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内 容 提要 


本 书 以 培养 读者 以 计算 机 科学 家 一 样 的 思维 方式 来 理解 Python 语 
言 编程 。 贯 穿 全 书 的 主体 是 如 何 思考 、 设 计 、 开 发 的 方法 ， 而 具体 的 
编程 语言 ， 只 是 提供 了 一 个 具体 场景 方便 介绍 的 媒介 。 


全 书 共 21 章 ， 详 细 介绍 Python 语言 编程 的 方方面面 。 本 书 从 最 基 
本 的 编程 概念 开始 讲 起 ， 包 括 语言 的 语法 和 语义 ， 而 且 每 个 编程 概念 
都 有 清晰 的 定义 ， 引 领 读 者 循序 渐进 地 学 习 变 量 、 表 达 式 、 语 句 、 画 
数 和 数据 结构 。 书 中 还 探讨 了 如 何 处 理 文件 和 数据 库 ， 如 何 理 解 对 
象 、 方 法 和 面向 对 象 编程 ， 如 何 使 用 调试 技巧 来 修正 语法 错误 、 运 行 
时 错误 和 语义 错误 。 每 一 划 都 配 有 术语 表 和 练习 题 ， 方 便 读者 巩固 所 
学 的 知识 和 技巧 。 此 外 ， 每 一 章 都 抽出 一 证 来 讲解 如 何 调试 程序 。 作 
者 针对 每 草 所 专注 的 语言 特性 ， 或 者 相关 的 开发 问题 ， 总 结 了 调试 的 
方方面面 。 


本 书 的 第 2 版 与 第 1 版 相 比 ， 做 了 很 多 更 新 ， 将 编程 语言 从 Python 
2 升级 成 Python 3， 并 修改 了 很 多 示例 和 练习 ， 增 加 了 新 的 草 和 ， 更 全 
面 地 介绍 Python 语言 。 


这 十 一 本 实用 的 学 习 指 南 ， 适 合 没 有 Python 编 程 经 验 的 程序 员 阅 
读 ， 也 适合 高 中 或 大 学 的 学 生 、Python 爱 好 者 及 需要 了 解 编程 基础 的 
人 阅读 。 对 于 第 一 次 接触 程序 设计 的 人 来 说 ， 是 一 本 不 可 多 得 的 佳 
人民 S 
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O'Reilly Media 通 过 图 书 、 杂 志 、 在 线 服务 、 调 查 人 研究 和 会 议 等 方 
式 传 播 创新 知识 。 自 1978 年 开始 ，O’Reilly 一 直 都 是 前 沿 发 展 的 见证 者 
和 推动 者 。 超 级 极 客 们 正在 开创 着 未 来 ， 而 我 们 关注 真正 重要 的 技术 
趋势 一 一 通过 放大 那些 “细微 的 信号 ?来 刺激 社会 对 者 科技 的 应 用 。 作 
为 技术 社区 中 活跃 的 参与 者 ，O’Reilly 的 发 展 充 满 了 对 创新 的 倡导 、 创 
造 和 发 扬 光 大 。 


O'Reilly 为 软件 开发 人 员 读 来 早 命 性 的 “动物 书 ”;， 创 建 第 一 个 商业 
网 站 (GNN) ; 组 织 了 影响 深远 的 开放 源 代码 峰会 ， 以 至 于 开源 软件 
运动 以 此 命名 ; 创立 了 Make 杂 志 ， 从 而 成 为 DIY 半 命 的 主要 先锋 ， 公 
司 一 如 既往 地 通过 多 种 形式 缔结 信息 与 人 的 纽 市 。O?Reilly 的 会 议和 峰 
会 集聚 了 众多 超级 极 客 和 高 瞻 远 瞩 的 商业 领袖 ， 共 同 拉 绘 出 开创 新 产 
业 的 章 命 性 思想 。 作 为 技术 人 士 获取 信息 的 选择 ，O’Reilly 现 在 还 将 先 
锋 专 家 的 知识 传递 给 普通 的 计算 机 用 户 。 无 论 是 通过 书籍 出 版 ， 在 线 
服务 或 者 面授 课程 ， 每 一 项 O'Reily 的 产品 都 反映 了 公司 不 可 动摇 的 理 


念 一 一 信息 是 激发 创新 的 力量 。 
业界 评论 


“O'Reilly Radar 博 客 有 口 缘 碑 。” 


Wired 


“O"Reilly 和 凭借 一 系列 (真希 望 当初 我 也 想到 了 ) 非凡 想法 建立 了 
数 百 万 美元 的 业务 。” 


Business 2.0 
“O’Reilly Conference 是 聚集 关键 思想 领袖 的 绝对 典 
——CRN 


“一 本 O”Reilly 的 书 束 代 表 一 个 有 用 、 有 前 途 、 和 需要 学 习 的 主题 。 


Irish Times 


“Tim 是 位 符 立 独行 的 商人 ， 他 不 光 放 眼 于 最 长 远 、 最 广阔 的 视野 
并 且 切 实地 按照 Yogi Berra 的 建议 去 做 了 : “如 采 你 在 路 上 过 到 盆 路 
口 ， 走 小 路 〈 盆 路 ) 。 ”回顾 过 去 Tim 似 乎 每 一 次 都 选择 了 人 小路， 而且 
有 几 次 都 是 一 内 即 授 的 机 会 ， 尽 管 大 路 也 不 错 。” 


Linux Journal 
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本 书 的 奇特 历史 


1999 年 ， 我 正在 为 一 门 Java 的 编程 入 门 课程 备课 。 这 门 课 我 已 经 
教 过 3 个 学 期 ， 感 到 有 些 灰心 。 课程 的 不 及 格 率 太 高 ， 即 使 是 那些 及 格 
的 学 生 ， 也 只 获得 了 很 低 的 成 束 。 


我 发 现 问 题 之 一 是 教材 。 它 们 太 厚 ， 有 太 多 见 余 的 细 市 ， 而 针对 
编程 技巧 的 高 阶 的 指导 却 很 不 足 。 而 且 学 生 们 都 有 "陷阱 效应 ”的 否 
恼 : 开头 时 很 容易 ， 也 能 循序 渐进 ， 但 接着 在 第 5 章 左 右 ， 整 个 地 板 就 
突然 陷落 了 。 痢 内 容 来 得 太 多 、 太 快 ， 以 至 于 我 必须 花费 一 学 期 剩 下 
的 全 部 时 间 来 帮助 他 们 拾 回 丢失 的 片段 。 


开课 前 两 周 ， 我 决定 自己 来 编写 教材 。 我 的 目标 有 以 下 几 个 。 


。 尽量 和 傈 短 。 学 生 读 10 页 书 ， 比 不 读 50 页 书 要 好 。 

。 注意 词汇 。 我 党 试 尽量 少 用 术语 ， 并 在 第 一 次 使 用 它们 时 做 好 定 
Pe 

。 循序 渐进 。 为 了 避免 陷阱 效应 ， 我 抽出 了 最 困难 的 课题 ， 并 把 它 
们 划分 成 更 细 的 学 习 步 又 。 

。 专注 于 编程 ， 而 不 是 编程 语言 。 我 只 注意 包 润 了 Java 的 最 小 的 可 
用 子 集 ， 而 忽略 掉 其 他 。 


我 需要 一 个 标题 ， 所 以 心血 来 潮 选 择 了 “How to Think Like a 


Computer Scientist” ° 


第 1 版 教材 很 粗糙 ， 但 确实 有 效 。 学 生 们 读 完 读本 ， 懂 得 了 足够 
的 基础 知识 ， 以 至 我 其 至 可 以 利用 课堂 时 间 和 他 们 一 起 讨论 更 难 、 更 
有 趣 的 话题 ， 并 且 (最 重要 的 是 ) 可 以 让 学 生 们 有 足够 的 时 间 在 课 符 
上 做 练习 。 


我 将 这 本 书 按照 GNU 上 自由 文档 许可 协议 (GNU Free 
Documentation License) 发 布 ， 让 用 户 可 以 复制 、 修 改 和 分 发 本 书 。 


接 下 来 发 生 了 最 酶 的 事情 。Jeff Elkner， 弗 吉 尼 亚 州 的 一 位 高 中 老 
师 ， 使 用 了 我 的 书 ， 并 且 将 其 翻译 成 Python 语言 的 版 本 。 他 寄 给 我 他 
的 翻译 副本 ， 于 是 我 有 了 一 次 很 奇特 的 经 历 一 一 通过 读 我 自己 的 书 来 
学 习 Python。 通 过 绿茶 出 版 社 (Green Tea Press) ， 在 2001 年 我 出 版 了 
第 一 个 Python 版 本 。 


2003 年 ， 我 开始 在 欧 林 学 院 (Olin College) 教学 ， 并 第 一 次 需要 
教授 Python 语言 。 和 Java 的 对 比 非常 惊人 。 学 生 们 困扰 更 少 ， 学 会 得 
更 多 ， 从 事 更 有 意思 的 项 目 ， 总 的 来 说 得 到 了 更 多 的 乐趣 。 


在 那 之 后 我 一 直 继 续 拓展 这 本 书 的 内 容 ， 修 改 错误 ， 改 进 示例 ， 
并 增加 新 的 材料 、 尤 其 是 练习 。 

结果 殉 产 生 了 本 书 ， 并 改 用 了 不 那么 安 伟 符 旺 的 书 名 
Python 。 部 分 改动 如 下 所 述 。 


Think 


。 我 在 每 章 的 结尾 添加 了 一 节 关于 调试 的 说 明 。 这 些 章节 描述 寻找 
和 避免 bug 的 通用 技巧 ， 并 警示 Python 中 容易 出 错 的 误区 。 

。 我 增加 了 更 多 的 练习 ， 小 到 简短 的 理解 性 测试 ， 大 到 几 个 实际 工 
程 。 大 部 分 练习 都 附带 了 链接 ， 可 以 查看 我 的 解答 。 

。 我 添加 了 一 系列 案例 研究 一 较 长 的 示例 ， 包 括 练习 、 解 答 以 及 
讨论 。 

我 扩展 了 关于 程序 开发 计划 和 基础 设计 模式 的 讨论 。 

我 增加 了 关于 调试 和 算法 分 析 的 章节 。 


第 2 版 增加 了 如 下 几 个 新 特 性。 


全 书 内 容 和 辅助 代码 都 更 新 到 Python 3。 


增加 了 几 和 ， 以 及 更 多 关于 Web 的 细节 ， 以 帮助 初学 者 通过 浏览 
厂 承 能 开始 运行 Python， 而 不 需要 过 早 地 面 对 安 装 Python 的 问 


题 。 


对 于 第 4 章 的 “turtle 模块 >， 我 把 实现 从 以 前 目 己 开发 的 
Swampy 马 龟 绘图 包 ， 改 为 使 用 更 标准 的 Python 模块 turtle ,， 它 
更 容易 安装 ， 功 能 也 更 强大 。 

增加 了 新 的 一 章 *Python 拾 珍 ” 《第 19 章 ) ， 介 绍 Python 提 供 的 一 
些 并 不 必需 ， 但 有 时 会 很 方便 的 特性 。 


我 希望 你 喜欢 这 本 书 ， 并 斋 望 它 至 少 能 提供 一 点 帮助 ， 助 你 学 会 
像 计 算 机 科学 家 那样 编程 和 思考 。 


一 一 Allen B. Downey 


本 书 排版 约定 


本 书 使 用 下 列 排版 约定 。 


中 文 楷体 (英文 斜体 ) : 用 于 新 术语 、 文 件 名 和 文件 扩展 名 。 
黑体 字 : 表示 术语 表 中 定义 的 词汇 。 

等 宽 字 体 (constant width ) : 用 于 程序 清单 ， 以 及 段落 中 
间 的 代码 元 素 ， 如 变量 、 函 数 名 、 数 据 库 、 数 据 类 型 、 环 境 变 
量 、 语 句 或 关键 字 等 。 

加 粗 等 宽 字 体 ( constant with bo1ld ) : 表示 命令 或 其 他 应 
当 由 用 户 键入 的 文本 。 

等 宽 斜 体 字 ( constant width ) : 用 于 显示 需要 替换 为 用 
户 提 供 的 值 或 由 环境 确定 的 值 的 文本 。 


代码 示例 的 使 用 


补充 材料 〈 代 码 示例 、 练 习 等 ) 可 以 从 
http://www.greenteapress.com/thinkpython2/code 下 载 。 


本 书 的 目的 是 帮 你 完成 工作 。 一 般 来 说 ， 只 要 是 本 书 提 供 的 示例 
代码 ， 你 都 可 以 用 在 自己 的 程序 和 文档 中 。 如 果 你 不 是 要 复制 大 部 分 
的 代码 ， 束 不 需要 联系 我 们 申请 授权 。 例 如 ， 写 一 个 程序 ， 里 面 使 用 
了 本 书 中 的 几 段 代码 ， 不 需要 申请 授权 。 但 销售 或 分 发 O'Reilly 书 籍 的 


示例 光盘 则 需要 授权 。 回 答 问 题 中 引用 本 书 内 容 或 示例 代码 ， 并 不 需 
要 申请 授权 ,但 将 本 书 中 大 量 的 代码 引入 你 的 产品 文档 则 需要 授权 。 


在 引用 本 书 内 容 时 ， 我 们 并 不 强求 但 辟 励 你 注 明 出 处 。 引 用 通 肖 
包括 书 名 、 作 者 、 出 版 社 和 ISBN。 例 如 : “Think Python, 2nd Edition by 
Allen B. Downey (O’Reilly). Copyright 2016 Allen Downey, 978-1-4919- 
3936-9”。 


如 果 你 觉得 目 己 对 本 书 代 码 示例 的 使 用 超出 了 上 述 授 权 范 围 ， 可 
以 随时 联系 我 们 : permissions@oreilly.com 。 


联系 我 们 
请 将 关于 本 书 的 评论 和 问题 发 给 出 版 商 。 
美国 : 
O’Reilly Media, Inc. 
1005 Gravenstein Highway North 


Sebastopol, CA 95472 


昌国 : 


北京 市 西城 区 西直门 南大 街 ? 号 成 饮 大 厦 C 座 807 室 (100035) 


奥 亲 利 技术 咨询 〈 北 京 ) 有 限 公 司 


我 们 为 本 书 提供 了 专门 的 网 页 ， 上 面 有 勤 误 表 、 示 例 ， 以 及 其 他 
额外 的 信息 ， 可 以 通过 http://bit.ly/think-python_2E 访 问 该 网 页 。 


如 果 想 对 本 书 进行 评论 或 想 问 技术 问题 ， 请 将 邮件 发 到 


bookquestions(@®oreilly.com ° 


想 了 解 更 多 关于 我 们 的 书籍 、 课 程 、 会 议 ， 以 及 新闻 等 信息 ， 请 
登录 我 们 的 网 站 : http://www.oreilly.com 。 


我 们 的 其 他 联系 方式 如 下 。 
Facebook: http://facebook.com/oreilly 
Twitter: http://twitter.com/oreillymedia 


YouTube: http:/www.youtube.com/oreillymedia 
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页 献 者 列表 


在 最 近 几 年 中 ， 超 过 100 名 眼光 犀利 、 思 维 敏捷 的 读者 给 我 寄 来 了 
建议 和 修订 。 他 们 对 这 个 项 目的 页 献 和 热情 ， 对 我 是 极 大 的 帮助 。 


如 果 你 有 建议 或 者 修订 意见 ， 请 发 邮件 到 
feedback@thinkpython.com。 如 果 我 根据 你 的 回馈 做 出 了 修改 ， 会 将 你 
加 入 贡献 者 列表 中 (除非 你 要 求 被 隐藏 ，。 


如 采 你 给 出 错误 出 现 的 位 置 的 部 分 语句 ， 会 让 我 更 容易 搜索 。 页 
码 或 者 草 下 编号 也 可 以 ， 但 并 不 那么 容易 处 理 。 谢 谢 ! 


Lloyd Hugh Allen 对 8.4 节 提出 了 修订 建议 。 

Yvon Boulianne 对 第 5 章 提 出 了 一 个 语义 错误 的 修订 建议 。 

Fred Bremmer 对 2.1 廊 提出 了 一 个 修订 建议 。 

Jonah Cohen 编 写 了 Pen 脚本 将 本 书 的 LaTeX 源 码 转换 成 美丽 的 
HIML 。 

Michael Conlon 提 出 了 第 2 章 的 一 个 语法 错误 ， 并 提出 第 1 章 的 格式 
改进 ， 并 且 他 开启 了 对 解释 器 的 技术 讨论 。 


Benoit Girard 寄 来 一 个 对 5.6 节 的 有 趣 的 修订 。 

Courtney Gleason 和 Katherine Smith 编写 了 horsebet ,py ， 在 本 
书 的 早期 版 本 中 作为 一 个 案例 研究 。 他 们 的 程序 现在 可 以 在 网 站 
上 找到 。 

Lee Harr 提 交 了 很 多 修订 建议 ， 我 们 没有 空间 在 这 里 一 一 列 出 ， 

并 且 他 确实 应 当 被 列 为 本 书 的 一 位 主要 编辑 。 

James Kaylin 是 一 名 使 用 本 书 的 学 生 。 他 提交 了 许多 修订 。 

David Kershaw 修正 了 3.10 节 中 错误 的 catTwice 函数 。 

Eddie Lam 提 出 了 第 1 章 、 第 2 章 和 人 第 3 章 的 很 多 修订 建议 ， 他 也 修 
正 了 Makefie， 这 样 第 一 次 运行 时 会 目 动 建立 索引 。 他 也 帮助 我 们 
设置 了 一 个 版 本 管理 方案 。 

Man-Yong Lee 寄 来 了 对 2.4 市 中 的 示例 代码 的 修订 。 

David Mayo 指 出 第 1 章 中 的 单词 “unconsciously” 需 要 被 修改 

为 “Subconsciously”。 

Chris McAloon 寄 来 了 对 3.9 节 和 3.10 节 的 一 些 修 订 。 

Matthew J. Moelter 是 本 书 的 长 期 页 献 者 ， 提 出 了 很 多 修订 建议 。 
Simon Dicon Montford 报 告 了 第 3 章 中 缺失 的 函数 定义 以 及 几 个 错 
别 字 。 他 也 发 现 了 第 13 章 中 的 jncrement 函数 的 错误 。 

John Ouzts 修正 了 第 3 章 中 “返回 值 ”* 的 定义 。 

Kevin Parks 对 关于 本 书 如 何 分 布 提出 了 有 价值 的 评论 和 建议 。 
David Pool 发 来 了 第 1 章 中 术语 表 中 的 错别字 ， 以 及 或 励 的 赞美 之 


Michael Schmitt 寄 来 了 关于 文件 和 异常 的 草 世 的 修订 建议 。 
Robin Shaw 指 出 了 13.1 节 中 的 一 个 错误 ，printTime 函 数 在 一 个 示 
例 中 没有 定义 就 使 用 了 。 


Paul Sleigh 在 第 7 章 中 找到 一 个 错误 ， 并 发 现 了 Jonah Cohen 用 于 生 
成 HTML 的 Perl 脚 本 的 bug 。 

Craig T. Snydal 在 德 鲁 大 学 (Drew University) 的 一 门 课 上 试验 这 
个 课本 ， 他 提出 了 好 几 个 有 价值 的 建议 和 修订 。 

Ian Thomas 和 他 的 学 生 们 使 用 这 本 书 作为 编程 课程 的 教材 。 他 们 
第 一 个 尝试 使 用 本 书后 半 部 分 的 划 节 ， 并 且 提 出 了 许多 勘误 和 建 
议 o 

Keith Verheyden 发 来 了 第 3 章 的 一 个 修正 。 

Peter Winstanley 让 我 们 知道 了 第 3 草 的 拉丁 文中 一 个 长 期 存在 的 错 
误 。 

Chris Wrobel 修 正 了 文件 WO 和 异常 一 章 的 代码 错误 。 

Moshe Zadka 对 本 书 有 不 可 估量 的 页 献 。 他 编写 了 关于 字典 的 一 章 
的 第 1 版 草稿 ， 并 在 本 书 的 早期 阶段 持续 提供 指导 。 

Christoph Zwerschke 发 来 了 几 个 勤 误 和 教学 法 的 建议 ， 并 解释 了 
gleich 和 selbe 的 区 别 。 

James Mayer 发 送 给 我 们 非常 多 的 拼写 错误 ， 包 括 贡 献 者 列表 中 的 
两 个 错误 。 

Hayden McAfee 发 现 了 两 个 示例 之 间 湾 在 的 冲突 。 

Angel Arnal 是 翻译 本 书 的 西班牙 语 版 本 的 国际 团队 的 一 员 。 他 也 
发 现 了 英文 版 中 的 几 个 错误 。 

Tauhidul Hoque 和 Lex Berezhny 创 建 了 第 1 章 中 的 图 表 ， 并 改进 了 
很 多 其 他 图 表 。 

Dr Michele Alzetta 发 现 了 第 8 章 中 的 一 个 错误 ， 并 发 来 了 一 些 有 趣 
的 教学 法 评论 ， 以 及 关于 斐 波 那 契 数列 和 Old Maid 的 建议 。 


Andy Mitchell 发 现 了 第 1 章 中 的 一 个 录入 错误 ， 以 及 第 2 章 中 一 个 
错误 的 示例 。 

Kalin Harvey 对 第 7 章 的 一 个 说 明 提 供 了 建议 ， 并 发 现 了 儿 个 录入 
省 误 。 

Christopher P. Smith 发 现 了 几 个 录入 错误 ， 并 帮助 我 们 更 新 本 书 到 
Python 2.2° 

David Hutchins 发 现 了 前 言 中 的 一 个 错别字 。 

Gregor Lingl 在 奥地利 维也纳 的 一 个 高 中 教授 Python。 他 正在 翻译 
本 书 的 德 文 版 ， 并 发 现 了 第 5 章 中 的 几 个 错误 。 

Julie Peters 发 现 了 前 言 中 的 一 个 错别字 。 

Florin Oprina 发 来 一 个 makeTime 的 改进 ，printTime 的 一 个 修 
正 ， 以 及 发 现 的 一 个 重要 的 录入 错误 。 

D. J. Webre 对 第 3 章 的 一 个 说 明 提 出 了 建议 。 

Ken 在 第 8、9、11 章 中 发 现 了 好 几 个 错误 。 

Ivo Wever 在 第 5 章 发 现 一 个 录入 错误 ， 并 对 第 3 章 中 的 一 个 说 明 提 
出 了 建议 。 

Curtis Yanko 对 第 2 章 中 的 一 个 描述 提出 了 建议 。 

Ben Logan 发 来 许多 发 现 的 孙 入 错误 ， 并 发 现 了 翻译 HTML 的 问 
题 。 

Jason Armstrong 发 现 了 第 2 章 中 一 个 漏 掉 的 词 。 

Louis Cordier 发 现 了 第 16 章 中 有 一 个 代码 和 文本 不 一 致 的 地 方 。 
Brian Cain 在 第 2 章 和 第 3 章 中 提出 了 几 个 描述 的 改进 建议 。 

Rob Black 发 来 了 许多 勘误 ， 包 括 一 些 针对 Python 2.2 的 修改 。 
巴黎 中 央 理 工大 学 的 Jean-Philippe Rey 发 来 了 一 些 补 本 ， 包 括 对 
Python 2.2 的 更 新 ， 以 及 其 他 一 些 细心 的 改进 。 


乔治 华盛顿 大 学 的 Jason Mader 提 供 了 许多 有 用 的 建议 和 改正 。 
Jan i a error” 应 改 为 “an error”。 
Abel David 和 Alexis Dinno 提醒 我 们 “matrix” 的 复数 形式 
是 “matrices” 而 不 是 “matrixes”。 这 个 错误 在 书 中 已 经 存在 了 多 


年 ， 但 两 个 姓名 以 同样 的 字母 开头 的 读者 同一 天 报告 了 它 。 真 的 


很 奇怪 


Charles Thayer 茎 励 我 们 删除 挥 一 些 语句 结尾 的 分 号 ， 并 建议 我 们 


理 清 “ 形 参 * 和 “ 实 参 ”的 使 用 。 

Roger Sperberg 指 出 了 第 3 章 的 一 个 逻辑 错误 。 

Sam Bull 指 出 了 第 2 章 中 一 段 令 人 困惑 的 描述 。 

Andrew Cheung 指 出 了 两 处 “定义 前 和 完 使 用 ”的 错误 。 
C.Corey Capel 发 现 缺 了 单词 ， 以 及 第 4 章 的 一 个 永 入 错误 。 
Alessandra 帮助 我 们 理 清 了 一 些 关 于 Turtle 的 困惑 。 

Wim Champagne 在 字典 示例 中 发 现 一 个 错误 。 

Douglas Wright 在 弧度 计算 中 发 现 了 一 个 除法 向 下 取 整 的 错误 。 
Jared Spindor 发 现 了 一 处 句 尾 的 无 用 词 。 

Lin Peiheng 发 来 了 许多 很 有 用 的 建议 。 

Ray Hagtvedt 发 来 了 两 处 错误 和 一 处 不 是 那么 错 的 错误 。 
Torsten Hiibsch 指 出 Sawmpy 中 的 一 处 不 一 致 。 

Inga Petuhhov 修 正 了 第 14 章 中 的 一 个 示例 。 

Arne Babenhauserheide 发 来 了 几 个 有 用 的 勘误 。 

Mark E. Casida 非 常 善 于 发 现 重复 的 单词 。 

Scott Tyler 填 上 了 一 个 缺失 的 “that*"， 并 发 米 了 一 堆 勘 误 。 
Gordon Shephard 发 来 了 几 个 勤 误 ， 每 个 都 用 单独 的 邮件 。 
Andrew Turner 发 现 了 第 8 章 中 的 一 个 错误 。 


Adam Hobart 修 正 了 一 个 在 弧度 计算 中 除法 癌 下 取 整 的 错误 。 
Daryl Hammond 和 Sarah Zimmerman 指 出 我 过 早 提出 了 math .pi 
°。 并且 Zim 发 现 了 一 个 录入 错误 。 
George Sass 在 调试 革 广 中 发 现 了 一 个 bug。 
Brian Bingham 建 议 了 练习 11-10。 
Leah Engelbert-Fenton 指 出 我 用 tuple 作为 变量 名 称 ， 这 恰恰 违反 
了 我 目 己 的 建议 。 然 后 他 发 现 了 一 扒 永 入 错误 以 及 一 个 “定义 前 先 
使 用 ”。 
Joe Funke 发 现 了 一 个 录入 错误 。 
Chao-chao Chen 在 斐 波 那 契 示例 中 发 现 了 一 个 不 一 致 处 。 
Jeff Paine 知 道 space 和 spam 的 区 别 。 
Lubos Pintes 发 来 一 个 录入 错误 。 
Gregg Lind 和 Abigail Heithoff 建 议 了 练习 14-4。 
Max Hailperin 发 来 了 许多 勘误 和 建议 。Max 是 非 几 的 Concrete 
Abstractions (Course Technology 1998) 一 书 的 作者 之 一 。 在 读 完 
本 书 之 后 你 可 能 会 想 要 读 那 本 书 。 
Chotipat Pornavalai 在 一 个 错误 信息 中 发 现 了 一 个 错误 。 
Stanislaw Antol 寄 来 了 一 个 很 有 用 的 建议 列表 。 
Eric Pashman 对 第 4 革 到 第 11 半 发 来 了 许多 勘误 。 
Miguel Azevedo 发 现 了 一 些 录 入 错误 。 
Jianhua Liu 发 来 了 一 长 列 勘误 。 
Nick King 发 现 了 一 个 缺失 单词 。 
Martin Zuther 发 来 了 一 长 列 建 议 。 
Adam Zimmerman 发 现 了 我 举例 的 一 个 “实例 ”中 的 不 一 致 处 ， 以 及 
其 他 一 些 错误 。 


Ratnakar Tiwari 建 议 加 一 个 脚注 说 明 什么 是 “退化 ”三 角形 。 
Anurag Goel 提 出 了 is_abecedarian 的 另 一 个 解答 ， 并 发 来 其 
他 一 些 勘 误 。 他 还 知道 如 何 拼写 Jane Austen 。 

Kelli Kratzer 发 现 了 一 个 录入 错误 。 

Mark Griffiths 指 出 了 第 3 章 中 的 一 个 令 人 困惑 的 示例 。 

Roydan Ongie 发 现 了 我 的 牛顿 方法 的 一 个 错误 。 

Patryk Wolowiec 帮 有 我 解决 了 一 个 HIML 版 本 的 问题 。 

Mark Chonofsky 告 诉 我 Python 3 中 的 新 关键 字 。 

Russell Coleman 帮 我 修正 了 几何 错误 。 

Wei Huang 发 现 了 几 处 录入 错误 。 

Karen Barber 发 现 了 本 书 中 最 古老 的 录入 错误 。 

Nam Nguyen 发 现 了 一 个 录入 错误 ， 并 指出 我 使 用 了 装饰 器 模式 但 
并 没有 用 它 的 名 字 。 

Stéphane Morin 发 来 了 一 些 建 议和 勘误 。 

Paul Stoop 修 改 了 一 个 uses_only 中 的 录入 错误 。 

Eric Bronner 指 出 了 关于 操作 符 顺 序 的 讨论 中 的 一 个 困惑 之 处 。 
Alexandros Gezerlis 提 交 的 建议 的 数量 和 质量 都 设置 了 一 个 新 的 标 
准 。 我 们 非常 感谢 他 ! 

Gray Thomas 知 道 哪 边 是 左 哪 边 古 右 。 

Giovanni Escobar Sosa 发 来 一 长 列 的 勘误 和 建议 。 

Alix Etienne 修 正 了 一 个 URL。 

Kuang He 发 现 一 个 永 入 错误 。 

Daniel Neilson 修 正 了 一 个 关于 操作 符 顺 序 的 错误 。 

Will McGinnis 指 出 polyline 在 两 个 地 方 定义 的 不 同 。 

Swarup Sahoo 发 现 了 一 个 缺失 的 分 号 。 


Frank Hecker 指 出 一 个 练习 不 细致 ， 并 发 现 了 几 个 坏 链 接 。 
Animesh B 帮 助 我 清理 了 一 个 令 人 困惑 的 示例 。 

Martin Caspersen 发 现 了 两 处 取 整 错误 。 

Gregor Ulm 发 来 一 些 勘 误 和 建议 。 

Dimitrios Tsirigkas 建 议 我 更 清晰 地 描述 一 个 练习 。 

Carlos Tafur 发 送 了 一 整 页 勘误 和 建议 。 

Martin Nordsletten 在 一 个 练习 解答 中 找到 了 一 个 bug 。 

Lars O. D. Christensen 找 到 了 一 个 失效 的 引用 。 

Victor Simeone 找到 了 一 个 录入 错误 。 

Sven Hoexter 指 出 一 个 叫 作 input 的 变量 名 履 盖 了 内 置 范 数 名 。 
Viet Le 找到 了 一 个 录入 错误 。 

Stephen Gregory 指 出 Python 3 中 cmp 的 问题 。 

Matthew Shultz 告 知 我 一 个 失效 链接 。 

Lokesh Kumar Makani 告 知 我 儿 个 失效 链接 ， 以 及 出 钳 消 息 的 改 


Ishwar Bhat 修 正 了 我 对 费 马 大 定理 的 描述 。 

Brian McGhie 建 议 了 一 个 更 清晰 的 曾 述 。 

Andrea Zanella 将 本 书 翻 译 成 意大利 语 ， 并 发 送 了 一 些 勘 误 。 
非常 感谢 Melissa Lewis 和 Luciano Ramalho 出 色 的 评论 ， 以 及 对 本 
书 第 2 版 的 建议 。 

感谢 PythonAnywhere 的 Harry Percival 帮 助人 们 在 浏 虎 右 中 运行 
Python。 

Xavier Van Aubel 对 第 2 版 做 出 了 几 个 有 用 的 修正 。 


第 1 章 ”程序 之 道 


本 书 的 目标 是 教会 你 像 计算 机 科学 家 一 样 思 考 。 这 种 思考 方式 绿 
合 了 数学 、 工 程 学 以 及 目 然 科 学 的 一 些 最 优秀 的 特性 。 计 算 机 科学 家 
与 数学 家 类 似 ， 他 们 使 用 形式 语言 来 描述 理念 (特别 是 计算 ) ; 与 工 
程 师 类 似 ， 他 们 设计 产品 ， 将 元 件 组 逆 成 系统 ， 对 不 同 的 方案 进行 评 
佑 选择 ; 与 目 然 科 学 家 类 似 ， 他 们 观察 复杂 系统 的 行为 ， 构 建 科学 假 
说 ， 并 检验 其 预测 。 


作为 计算 机 科学 家 ， 最 重要 的 技能 就 是 问题 求解 。 问 题 求解 是 发 
现 问题 、 创 造 性 地 思考 解决 方案 以 及 清晰 准确 地 表达 解决 方案 的 能 
力 。 实 践 证 明 ， 学 习 编 程 的 过 程 ， 正 是 训练 问题 求解 能 力 的 绝 佳 机 
会 。 这 也 十 本 章 标题 用 “程序 之 道 ” 的 原因 。 


一 方面 ， 你 将 学 会 编程 ， 其 本 吴 吏 是 一 个 非常 有 用 的 技能 ， 另 一 
方面 ， 你 可 以 使 用 编程 作为 工具 ， 去 达到 更 高 的 目标 。 随 着 本 书 的 深 
入 ， 那 个 目标 会 逐渐 明晰 。 


1.1 什么 是 程序 


程序 是 指 一 组 定义 如 何 进行 计算 的 指令 的 集合 。 这 种 计算 可 能 是 
数学 计算 ， 如 解 方程 组 或 者 查找 多 项 式 的 根 ， 也 可 以 是 符号 运算 ， 如 
搜索 和 替换 文档 中 的 文本 ， 或 者 图 形 相 关 的 操作 ， 如 处 理 图 像 或 播放 
视频 。 


在 不 同 的 编程 语言 中 ， 程 序 的 细节 有 所 不 同 ， 但 儿 乎 所 有 编程 语 
言 中 都 会 出 现 以 下 几 类 基本 指令 。 


。 输 入 : 从 键盘 、 文 件 或 者 其 他 设备 中 获取 数据 。 

。 输 出: 将 数据 显示 到 屏幕 ， 保 存 到 文件 中 ， 或 者 发 送 到 网 络 上 
等 。 

。 数学: ”进行 基本 数学 操作 ， 如 加 法 或 乘法 。 

。 条 件 执行 : 检查 某 种 条 件 的 状态 ， 并 执行 相应 的 代码 。 

。 重复 : 重复 执行 某 种 动作 ， 往 往 在 重复 中 有 一 些 变化 。 


信 不 信和 由 你 ， 这 差不多 束 古 全 部 了 。 你 所 直到 过 的 所 有 程序 ， 无 
论 多 么 复杂 ， 都 是 由 类 似 上 面 的 这 些 指令 组 成 的 。 所 以 我 们 可 以 把 编 
程 看 作 一 个 将 大 而 复杂 的 任务 分 解 为 更 小 的 子 任务 的 过 程 ， 不 断 分 
解 ， 直 到 任务 简单 到 足以 由 上 面 的 这 些 基 本 指令 组 合 完成 


1.2 ”运行 Python 


Python 入 门 的 挑战 之 一 在 于 你 可 能 需要 自己 在 电脑 上 安装 Python 
及 相关 软件 。 如 果 你 熟悉 自己 的 操作 系统 ， 而 且 习 惯 于 命令 行 界面 ， 
那么 安装 Python 不 是 什么 问题 。 但 对 于 初学 者 来 说 ， 同 时 学 习 编 程 和 
系统 管理 命令 两 件 事 ， 有 时 候 是 非常 痛苦 的 。 


为 了 避免 这 个 问题 ， 我 推荐 你 开始 先 在 浏 咒 絮 中 运行 Python， 等 
熟悉 了 Python 语 言 之 后 ， 我 再 向 你 介绍 如 何在 电脑 上 安装 Python 。 


用 于 运行 Python 的 网 站 有 不 少 。 如 有 果 你 已 经 找到 一 个 喜欢 的 ， 整 
可 以 直接 去 用 。 如 采 没 有 ， 我 推荐 PythonAnywhere。 我 在 


http:Wtinyurl.comy/thinkpython2e 上 提供 了 详细 的 入 门 指导 。 


有 两 个 版 本 的 Python， 分 别 为 Python 2 和 Python 3。 它 们 很 类 似 ， 
所 以 如 果 你 学 会 了 一 个 版 本 ， 也 能 很 容易 地 切换 到 男 一 个 版 本 。 实 际 
上 ， 作 为 初学 者 ， 你 会 遇 到 的 两 者 之 间 的 区 别 非常 少 。 本 书 是 针对 
Python 3 编写 的 ， 但 我 也 会 给 出 一 些 关 于 Python 2 的 注意 事项 。 


Python 解释 器 是 一 个 读 取 并 执行 Python 代码 的 程序 。 根 据 所 在 环 
境 的 不 同 ， 你 可 能 需要 点 击 程序 图 标 ， 或 者 在 命令 行 中 键入 python 
命令 来 启动 解释 器 。 当 它 启动 以 后 ， 可 以 看 到 如 下 输出 : 


Python 3.4.0 (default, Jun 19 2015, 14:20:21) 
[GCC 4.8.2] on linux 
Type "help", "copyright", "credits" or "license" for more 


information. 
>>> 


前 3 行文 本 包含 了 解释 器 和 所 运行 的 操作 系统 的 信息 ， 所 以 可 能 二 
你 看 到 的 有 些 区 别 。 但 你 应 当 检查 版 本 号 是 否 以 3 开头 (本 例 所 示 的 是 
3.4.0 ) ， 表 示 你 使 用 的 是 Python 3 的 解释 器 。 如 果 版 本 号 以 2 开头 ， 
那么 〈 你 肯定 猜 到 了 ) 解释 器 是 Python 2。 


最 后 一 行 是 一 个 提示 符 ， 表 明 解 释 器 已 经 准备 好 ， 等 竺 你 键入 代 
码 。 如 果 你 键入 一 行 代码 并 按 下 Enter 键 ， 解 释 锅 会 显示 结果 : 


>>> 1 + 工 
2 


1.3 ”第 一 个 程序 


依照 传统 ， 用 新 语言 编写 的 第 一 个 程序 叫 “Hello, World!”， 因 为 这 
个 程序 所 做 的 事情 就 是 只 显示 “Hello, World!”。 在 Python 中 ， 它 是 这 个 
样子 ; 


>>> print('Hello, World!') 


这 是 print 语句 的 一 个 示例 。print 并 不 会 真 往 纸 上 打 印 文 
字 ， 而 十 在 屏 大 上 显示 结果 。 在 这 个 例子 中 ， 输 出 的 结果 厦 : 


Hello, World! 


程序 中 的 引号 表示 要 显示 的 文本 的 开始 和 结束 ， 在 输出 结果 中 它 
们 并 不 显示 。 


括号 表示 print 是 一 个 函数 。 我 们 将 在 第 3 草 中 讨论 函数 。 


在 Python 2 中 ，print 语句 略 有 不 同 。 它 不 是 一 个 画 数 ， 所 以 不 
使 用 括号 


>>> print 'Hello, World!' 


这 个 区 别 的 意义 在 后 面 会 慢 慢 显现 ， 但 现在 只 需要 知晓 就 足够 
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1.4 算术 操作 符 


介绍 完 “Hello, World” 之 后 ， 接 下 来 是 算术 操作 。Python 提 供 了 操 
作 符 ， 即 像 加 号 或 减 号 这 样 的 用 来 表达 计算 操作 的 特殊 符号 。 


操作 符 +、- 和 * 分 别 表示 进行 加 法 、 减 法 和 乘法 和 运算， 如 下 面 示例 
所 二 


操作 符 /表示 除法 运算 : 


>>> 84 / 2 
42.0 


这 里 你 可 能 会 奇怪 为 什么 结果 是 42 .0 而 不 是 42 。 我 会 在 下 一 节 


最 后 ， 操 作 符 ** 表示 进行 指数 运算 。 也 束 是 说 ， 会 把 一 个 数 按 指 
数 进 行 乘 方 : 


>>> 6**2 + 6 
42 


在 其 他 一 些 语言 中 ， 指 数 操作 用 ^ 符号 表示 ， 但 在 Python 中 人 ^ 这 
个 符号 已 经 用 来 表示 二 进 制 按 位 运算 XOR 了。 如 末 你 不 刚 悉 按 位 运 
算 ， 结 果 可 能 会 让 你 感到 奇怪 : 


>>> 6 人 2 
4 


本 书 我 不 会 讨论 按 位 操作 符 ， 但 读者 可 以 在 
http://wiki.python.org/moin/BitwiseOperator 上 阅读 相关 文档 。 


1.5” 值 和 类 型 


值 (value) 是 程序 操作 的 最 基本 的 东西 ， 如 一 个 字母 或 者 数字 。 
前 面 我 们 见 过 一 些 值 ， 如 2、42.0 以 及 'Hello, World!' 。 


这 些 值 属 于 不 同 的 类 型 (type) : 2 是 整 型 (integer) 的 ，42 .0 
是 浮 点 型 (floating-point) 的 ， 而 'Hello，World!' 是 字符 串 
(string) 类 型 的 ， 这 么 称呼 是 因为 它 是 由 一 扒 字 母 * 串 连 ?起 来 的 。 


如 有 果 不 确认 一 个 值 的 类 型 ,解释 器 可 以 告诉 你 : 


>>> type(2) 
<class 'int'> 
>>> type(42.0) 
<class 'float'> 


>>> type('Hello, World!') 
<type 'str'> 


在 这 些 结果 中 ， 单 词 “class” (类) 被 用 于 某 一 类 型 中 ， 这 是 一 种 
值 类 型 。 

不 足 为 奇 ， 整 数 属于 1int' 类 型 ,字符 囊 属于 'str' 类 型 ， 而 浮 
点 数 属于 'float' 类 型 。 


那么 '2' 和 '42.9' 这 样 的 值 呢 ? 它们 看 起 来 像 是 数字 ， 但 又 使 
用 字符 串 常 用 的 引号 括 起 来 : 


>>> type( 2 ) 


当 输 入 一 个 很 大 的 数字 时 ， 你 可 能 会 忍 不 住 想 在 数字 中 间 加 上 去 
号 ， 就 像 1, 000, 000 这 样 。 在 Python 中 这 并 不 是 合法 的 整数 ， 但 它 凌 
巧 又 是 一 个 合法 的 表达 式 : 


>>> 1,000,000 
(1, 0, 9) 


当然 ， 这 和 我 们 预期 的 完全 不 同 ! Python 把 1, 000, 0009 解释 成 一 
个 用 过 号 分 隔 的 整数 序列 。 关 于 这 种 序列 在 本 书后 面 可 以 学 到 更 多 内 


1.6 形式 语言 和 目 然 语言 


自然 语言 是 指 人 们 所 说 的 语言 ， 如 英语 、 西 班 牙 语 和 法 语 。 它 们 
不 是 由 人 设计 而 来 的 (虽然 人 们 会 尝试 加 以 语法 限制 ，， 而 是 上 自然 演 
化 而 来 的 。 


形式 语言 则 是 人 们 为 了 特殊 用 途 设计 的 语言 。 例 如 ， 数 学 上 使 用 
的 符号 体系 是 一 种 特别 擅 于 表示 数字 和 符号 之 间 关 系 的 形式 语言 ;化 


学 家 则 使 用 另 一 种 形式 语言 来 表示 分 子 的 化 学 结构 。 而 最 重要 的 是 : 
编程 语言 是 人 们 为 了 表达 计算 过 程 而 设计 出 来 的 形式 语言 。 


形式 语言 倾向 于 对 语法 做 出 严格 的 限制 。 例 如 ，3 + 3 = 6 是 语法 
正确 的 数学 表达 式 ， 但 3+ = 3$6 则 不 是 。H, O 是 语法 正确 的 化 学 方程 
Rs 而 ， Zz 则 不 是 时 


语法 规则 有 两 种 ， 分 别 适 用 于 记号 (token) 和 结构 
(structure) 。 记 号 是 语言 的 基本 元 素 ， 如 词 、 数 字 和 化 学 元 素 。3+ = 
3$6 的 一 个 问题 就 是 $ 在 数学 表达 式 中 (至 少 就 我 所 知 ) 不 是 合法 记 
号 。 相 似 地 ，, Zz 不 合法 是 因为 并 不 存在 缩写 为 Zz 的 化 学 元 素 。 


第 二 种 语法 规则 指定 记号 所 组 合 的 方式 。 数 学 等 式 3+ = 3 不 合 
法 ， 因 为 虽然 + 和 = 是 合法 记号 ， 但 不 能 将 它们 连续 放置 。 相 似 地 ， 在 
化 学 表达 式 里 ， 下 标 数 字 应 该 出 现在 元 素 名 称 之 后 ， 而 不 是 之 前 。 


“This is @ well-structured Engli$h sentence with invalid t*kens in 
it.” 是 一 个 结构 民 好 ， 但 包含 非法 记号 的 英语 语句 。“This sentence all 
valid tokens has, but invalid structure with.” 这 人 句 话 所 有 的 记号 都 合法 ， 
但 是 语句 结构 不 合法 。 


当 你 阅读 英语 的 句子 或 形式 语言 的 语句 时 ， 和 需要 和 弄 清 句子 的 结构 
是 什么 (虽然 在 自然 语言 中 这 个 过 程 是 下 意识 完成 的 ) 。 这 个 过 程 称 
为 语法 分 析 。 


里 然 形式 语言 和 目 然 语言 有 很 多 共同 的 特点 一 一 记号 、 结 构 、 语 
法 以 及 语义 ， 但 它们 也 有 一 些 区 别 。 


。 层 义 性 : 目 然 语言 充满 了 攻 义 ， 人 们 通过 上 下 文 线索 和 其 他 信息 
来 处 理 这 些 层 义 。 形 式 语 言 通常 设计 为 几乎 或 者 完全 没有 歧义 ， 

即 不 论 上 下 文 环境 如 何 ， 任 何 表达 式 都 只 有 一 个 侣 义 。 

见 余 性 为 了 弥补 歧义 ,减少 广 解 ， 目 然 语言 采用 大 量 的 风 余 。 
因此 ， 目 然 语 言 往往 很 哆 嗪 。 形 式 语 言 则 相对 不 那么 元 余 ， 更 加 
简洁 。 

字面 性 ， 目 然 语 言 充 满 了 习惯 用 语 和 比喻 。 例 如 ， 有 人 说 ,“ 硬 
币 掉 了 ” (The penny dropped [1 ) ， 并 不 一 定 是 硬币， 也 不 一 定 

是 有 什么 控 了 。 形 式 语言 则 严格 按照 它 的 字面 意思 表达 含义 。 


因为 我 们 都 说 着 目 然 语言 长 大 ， 有 时候 很 难 适应 形式 语言 。 在 某 
种 意义 上 ， 形 式 语言 和 目 然 语言 的 区 别 与 诗词 和 散文 的 区 别 类 似 ， 而 
且 程 度 更 其 。 


。 诗词 : 字 词 的 使 用 ， 既 考虑 它们 的 音韵， 也 考虑 到 它们 的 意义 ， 
而 整 首 诗 合 起 来 表达 某 种 意境 或 情绪 反应 。 牙 义 不 仅 彰 见 ， 而 且 
营 凋 是 刻意 为 之 。 

散文 : 字 词 的 意义 更 加 重要 ， 而 且 句 子 的 结构 也 提供 更 多 的 意 
义 。 散 文 比 请 词 更 容易 分 析 ， 但 仍然 有 不 少 歧义 。 

程序 .计算 机 程序 的 意义 不 含 层 义 ， 直 接 如 字面 所 指 。 完 全 可 以 
通过 它 的 记号 和 结构 理解 其 意义 。 


形式 语言 的 密度 远 远 大 于 目 然 语言 ， 所 以 阅读 起 来 需要 化 费 更 多 
的 时 间 。 还 有 ， 结 构 非 党 重要 ， 所 以 直接 目 顶 癌 下 、 从 左 至 右 的 阅读 
顺序 并 不 一 定 是 最 好 的 。 相 反 ， 要 试 着 学 会 在 头脑 中 解析 程序 ， 辩 别 
出 记号 并 解析 出 结构 。 最 后 ， 细 市 很 重要 。 在 目 然 语 言 中 党 第 可 以 忽 


略 的 小 错误 ， 如 拼写 错误 或 者 标点 符号 错误 ， 在 形式 语言 中 往往 会 造 
成 很 大 的 差别 。 


1.7 调试 


程序 是 很 容易 出 错 的 。 因 为 某 种 古怪 的 原因 ， 程 序 错 误 被 称 为 
bug ， 而 查 捕 bug 的 过 程 称 为 调试 (debugging) 。 


一 个 程序 中 可 能 出 现 3 种 类 型 的 错误 : 语法 错误 、 运 行 时 错误 和 语 
义 错误 。 对 它们 加 以 区 分 ， 可 以 更 快 地 找到 错误 。 


编程 ， 特 别 生 调试， 有 时 候 会 引发 强烈 的 情绪 。 如 采 你 挣扎 于 一 
个 困难 的 bug， 可 能 会 感觉 到 丑 息 、 诅 起 以 及 窘迫 。 


有 证 据 表 明 ， 人 们 会 像 对 待人 一 样 对 竺 电脑 。 当 电脑 民 好 完成 工 
作 时 ， 我 们 会 把 它们 当 作 队友 ， 而 当 它们 难以 控制 、 粗 又 无 礼 的 时 
候 ， 我 们 会 按照 对 待 那 些 粗 暴 固 执 的 人 一 样 对 待 它们 (The Media 
Equation: How People Treat Computers, Television, and New Media Like 


Real People and Places ，Reeves 和 Nass 著 ) 。 
对 这 些 反 应 行为 有 所 准备 ， 可 能 会 帮助 你 更 好 地 对 待 电脑。 一 种 


方法 是 把 它 当 作 你 的 雇员 ， 它 有 一 定 的 长 处 ， 如 速度 和 精度 ， 也 有 特 
定 的 弱点 ， 如 没有 同情 心 和 无 法 顾全 大 局 。 


你 的 任务 是 做 一 个 好 经 理 ， 设 法 扬长 避 短 ， 并 找到 方法 控制 你 的 
情绪 去 面 对 问 题 ， 而 不 是 让 你 的 反应 影响 工作 效率 。 


学 习 调试 可 能 会 带 来 挫折 感 ， 但 它 是 一 个 有 价值 的 技能 ， 并 在 编 
程 之 外 还 有 很 多 用 途 。 每 章 的 结尾 处 都 有 一 节 类 似 于 本 节 的 关于 调试 
技巧 的 讨论 。 和 希望 它们 能 带 来 帮助 ! 

1.8 术语 表 

问题 求解 (problem solving) : 总 结 问 题 、 寻 找 解决 方案 以 及 表 

达 解 决 方案 的 过 程 。 


高 级 语言 (high-level language) : 设计 来 方便 人 们 读 写 的 编程 语 
言 ， 如 Python 。 


低级 语言 〈low-level language) : 设计 来 方便 计算 机 执行 的 编程 
语言 ， 也 被 称 为 “机 絮语 言 * 或 “汇编 语言 ”。 


可 移植 性 (portability) : 程序 的 一 种 属性 ， 可 以 在 多 种 类 型 的 计 
算 机 上 运行 。 


解释 器 (interpreter) ， 一 个 读 取 其 他 程序 并 执行 其 内 容 的 程序 。 


提示 符 ”(prompt) : 解释 器 显示 的 文字 ， 提 示 用 户 已 经 准备 好 接 
收 用 户 的 输入 。 


程序 (program) : 一 系列 代码 指令 的 集合 ， 指 定 一 种 运算 。 


Print 语句 (print statement) : 一 个 指令 ， 可 以 通知 Python 解释 需 
在 屏幕 上 显示 一 个 值 。 


操作 符 《operator) : 一 种 特殊 符号 ， 用 来 表达 加 法 、 乘 法 或 字 
符 串 拼接 等 简单 运算 。 


值 (value) : 程序 操作 的 数据 基本 单位 ， 如 一 个 数字 或 一 个 字符 
串 。 


类 型 (type) : 值 的 类 别 。 到 目前 为 止 我 们 已 经 见 过 的 类 型 有 整 
数 (int ) 、 浮 点 数 (float ) 和 字符 串 (str) 。 


整 型 (integer) : 用 来 表示 整数 的 类 型 。 


浮 点 型 (floating-point) ， 用 来 表示 带 小 数 部 分 的 数 的 类 型 。 


字符 串 (string) : 用 来 表示 一 串 字 符 的 类 型 。 
自然 语言 (natural language) :自然 演化 而 来 的 人 们 所 说 的 语 
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形式 语言 (formal language) : 人 们 设计 为 某 些 特定 目的 (如 表 
达 数 学 概念 或 者 计算 机 程序 ) 设计 的 任何 一 种 语言 。 所 有 编程 语言 都 
属于 形式 语言 。 


记号 (token) : 程序 的 语法 结构 的 最 基本 单位 ， 类 似 于 自然 语言 
中 的 词 。 


语法 (syntax) : 用 于 控制 程序 结构 的 规则 。 


语法 分 析 (parse) : 检查 程序 并 分 析 其 语法 结构 。 


bug: 程序 中 的 错误 。 


调试 (debugging) : 发 现 和 纠正 bug 的 过 程 。 
1.9 E02 村 


练习 1-1 


在 计算 机 前 阅读 本 书 是 一 个 好 主意 ， 因 为 你 可 以 边 看 边 试验 书 中 
的 示例 。 


每 当 你 试验 新 的 语言 特性 时 ， 应 当 试 着 故意 犯错 。 例 如 ， 
在 “Hello，World!” 程 序 中 ， 如 有 果 少 写 一 个 引号 ， 会 发 生 什么 ?如 采 两 
个 引号 都 不 号， 会 怎么 样 ? 如 果 把 print 拼写 错 了 ， 会 如 何 ? 


这 种 试验 会 帮 你 记 住 所 读 的 内 容 ， 也 能 帮 你 学 会 调试 ， 因 为 这 样 
能 看 到 不 同 的 出 错 消 息 代 表 着 什么 。 现 在 故意 犯错 总 比 今后 在 编码 中 
意外 出 错 好 。 


1. 在 print 语句 中 ， 如 采 漏 卸 一 个 括号 ， 或 者 两 个 都 调控 ， 会 
A 


2. 如 有 果 正 笑 试 打印 一 个 字符 串 ， 那 么 铬 漏 挥 一 个 或 所 有 的 引号 ， 
会 发 年 什么 ? 


3， 可 以 使 用 一 个 负 号 来 表示 负数 ， 如 -2 。 如 采 在 数字 之 前 放 一 
个 正 号 ， 会 发 生 什么 ? 如 采 是 2++2 呢 ? 


4. 在 数学 标记 里 ， 前 置 0 是 没有 问题 的 ， 如 02 。 在 Python 中 也 这 
么 做 会 发 生 什么 ? 


5. 如 果 在 两 个 值 之 间 不 放任 何 操作 符 ， 会 发 生 什 么 ? 
练习 1-2 
启动 Python 解 释 器 ， 把 它 当 作 计 算 器 使 用 。 


1， 在 42 分 42 秒 中 ， 一 共有 多 少 秒 ? 


2.，10 千 米 相当 于 多 少 英 里 ? 提示 : 1 英里 相当 于 1.61 千 米 。 
3. 如 果 你 用 42 分 42 秒 跑 完 10 千 米 ， 那 么 你 的 平均 速度 ( 跑 1 千 米 


需要 的 分 钟 和 秒 数 ) 是 多 少 ? 平均 速度 是 多 少 千 米 每 小 时 ? 


[1]“The penny dropped” 在 英语 里 的 意思 是 : 经 过 一 段 困惑 后 ， 突 然 理 
解 了 某 个 事情 。 一 一 译 者 注 


第 2 章 ”变量 、 表 达 式 和 语句 


编程 语言 最 强大 的 特性 之 一 是 操纵 变量 的 能 力 。 变 量 是 指向 一 个 
值 的 名 称 。 


2.1 赋值 语句 


赋值 语句 可 以 建立 新 的 变量 ， 并 给 它们 赋值 : 


>>> message = 'And now for somthing completely different' 
>>> n = 17 


>>> pi = 3,1415926535897932 


这 个 例子 有 3 个 赋值 。 第 一 个 将 一 个 字符 串 赋 给 叫 作 message 的 
变量 ; 第 二 个 将 17 赋值 给 n ; 第 三 个 将 r 的 〈 近 似 ) 值 赋 给 变量 pi 。 


在 纸 上 表 达 变 量 的 一 个 常见 方式 是 写 下 名 称 ， 并 用 身 头 指 问 其 
值 。 这 种 图 称 为 状态 图 ， 因 为 它 显 示 了 每 个 变量 所 在 的 状态 (请 将 
看 作 变 量 的 心理 状态 ) 。 图 2-1 显 示 了 前 面 例子 的 状态 图 。 


[CS 


message 一 = And now for something completely different 


n —= 17 


pi 一 = 3.1415926535897932 


图 2-1 状态 图 


2.2 ”变量 名 称 


程序 员 稼 冲 选 择 有 意义 的 名 称 作 为 变量 名 一 一 以 此 标记 变量 的 用 


几 


变量 名 可 以 任意 长 短 。 它 可 以 包含 字母 和 数字 ， 但 必须 以 一 个 字 
Buen 使 用 大 写字 母 是 合法 的 ， 但 变量 名 使 用 小 写字 母 开 头 是 个 好 
意 (后 面 你 会 看 到 为 何如 此 ) 。 


下 划 线 “ ”可 以 出 现在 变量 名 称 中 。 它 经 常 出 现在 由 多 个 词组 成 的 


变量 名 中 ， 如 your_name 或 airspeed_of_unladen_swallow 。 


如 琳 给 变量 取 非 法 的 名 称 ， 会 得 到 一 个 语法 错误 : 


>>> 76trombones = 'big parade' 
SyntaxError: invalid syntax 
>>> more@ = 1000000 


SyntaxError: invalid syntax 
>>> class = 'Advanced Theoretical Zymurgy' 
SyntaxError: invalid syntax 


76trombones 非法 ， 因 为 它 以 数字 开头 。more@ 非法 ， 是 因为 
它 包 含 了 一 个 非法 字符 @。 但 class 有 什么 问题 ? 


原因 是 class 是 Python 的 一 个 关键 字 “。 解释 器 通过 关键 字 来 识别 
程序 的 结构 ， 并 且 它 们 不 能 用 来 作为 变量 名 称 。 


Python 2 共有 31 个 关键 字 : 
False class finally is return 
None continue for lambda try 


True def from nonlocal while 


and del global not with 


as elif if or yield 
assert else import pass 
break except in raise 


你 并 不 需要 记 住 这 个 清单 。 在 大 多 数 开发 环境 中 ， 关 键 子 会 以 不 
同 的 颜色 显示 。 如 采 把 它们 当 作 变 量 来 用 ， 会 很 容易 发 现 。 


2.3 ”表达 式 和 语句 


表达 式 是 值 、 变 量 和 操作 符 的 组 合 。 am 
达 式 ， 单 独 的 变量 也 是 如 此 。 所 以 下 面 都 是 合法 的 表达 式 : 


当 你 在 提示 符 之 后 键入 一 个 表达 式 时 ， 解 释 器 会 对 其 进行 求 值 ， 
即 莹 试 找 到 该 表达 式 的 最 终 值 。 在 本 例 中 ， 变 量 n 的 值 是 17， 而 表达 式 
n + 25 的 值 是 42。 


语句 是 一 段 会 产生 效果 的 代码 单元 ， 如 创建 新 变量 或 者 显示 一 个 
值 。 


>>> n = 17 
>>> print(n) 


第 一 行 是 一 个 赋值 语句 ， 将 值 17 赋 给 变量 n。 第 二 行 是 一 个 


print 语句 ， 显 示 变 量 n 的 值 。 


当 键入 一 行 语句 之 后 ， 解 释 器 会 执行 它 ， 也 就 是 说 会 按照 语句 所 
说 的 来 做 。 通 前 来 说 ， 语 句 本 号 没 有 值 。 


2.4 脚本 模式 


到 目前 为 止 我 们 都 是 在 交互 模式 (interactive mode) 下 运行 
Python， 直 接 与 解释 器 打交道 。 交 互 模式 非常 适合 入 门 ， 但 是 ， 如 果 你 
需要 编写 超过 几 行 的 代码 ， 它 可 能 显得 有 点 儿 策 拙 。 


男 一 种 编程 模式 是 把 代码 保存 称 为 脚本 的 文件 中 ， 并 以 脚本 模式 
(script mode) 运行 解释 器 ， 执 行 脚本 。 依 照 惯例 ，Python 脚 本 文件 通 
常 以 ,py 结尾 。 


如 果 你 已 经 了 解 在 自己 的 电脑 上 如 何 创 建 和 运行 脚本 ， 就 可 以 继 
续 学 习 了 “。 否则 我 再 次 建议 使 用 PythonAnywhere。 我 在 
http://tinyurl.com/thinkpython2e 上 写 下 了 如 何在 脚本 模式 下 运行 的 指 


于。 


由 于 Python 提 供 了 两 种 运行 模式 ， 你 可 以 在 交互 模式 中 笑 试 代码 片 
段 ， 然 后 将 其 放 到 脚本 中 。 但 交互 模式 和 脚本 模式 还 是 有 一 些 区 别 
的 ， 可 能 会 引起 困惑 。 


例如 ， 如 采 使 用 Python 作 为 计算 絮 ， 你 可 能 会 输入 : 


>>> miles = 26.2 
>>> miles * 1.61 
42 .182 


一 行 给 变量 miles 赋值 ， 但 没有 可 见 的 效果 。 第 二 行 是 一 个 表 
ey 所 以 解释 器 对 其 进行 求 值 ， 并 显示 结果 。 于 是 我 们 知道 马拉松 
的 长 度 大 概 是 42 千 米 。 


但 如 采 将 上 面 同样 的 代码 写 入 到 脚本 中 并 运行 ， 则 得 不 到 任何 输 
出 。 在 脚本 模式 中 ， 一 个 单独 的 表达 式 ， 也 是 没有 可 见效 果 的 。 > 
实际 上 会 对 表达 式 进 行 求 值 ， 但 不 会 显示 其 结 来 。 除 非 你 叫 它 这 
改 : 


miles = 26.2 
print (miles * 1.61) 


这 种 现象 一 开始 可 能 会 让 人 迷惑 。 


一 


脚本 通常 包 售 一 系列 的 语句 。 如 果 语 句 超过 一 行 ， 那么 会 随 着 语 
二 全 有 显 趟 征求 < 


例如 ， 脚 本 


print(1) 
X 二 :2 
print(x) 


产生 如 下 结 


赋值 语句 不 会 产生 任何 输出 。 


为 了 验证 你 的 理解 ， 可 以 在 Python 解释 器 中 输入 下 面 的 语句 ， 看 它 
们 做 了 什么 : 


xXx0o 
十 1 
a 


现在 把 同样 的 语句 存 入 到 一 个 脚本 文件 并 运行 。 输 出 是 什么 ? 修 
改 脚本 ， 将 所 有 的 表达 式 部 转换 成 print 语句 ， 表 运行 一 过 。 


2.5 ”操作 顺序 


当 一 个 表达 式 中 出 现 多 个 操作 符 时 ， 求 值 的 顺序 依赖 于 优先 级 规 
则 “。 对 数学 操作 符 ，Python 遵 守 数 学 的 传统 规则 。 缩 略 词 PEMDAS 可 
以 帮助 记忆 这 些 规则 : 


。 括号 (P ，Parentheses) 拥有 最 高 的 优先 级 ， 并 可 以 用 来 强制 表达 
式 按照 你 需要 的 顺序 进行 求 值 。 因 为 括号 中 的 表达 式 会 完 执行 ， 
所 以 2* (3-1) 的 结果 是 4， 而 (1+1)**(5-2) 的 结果 是 8。 你 也 
可 以 利用 括号 使 得 表达 式 更 加 易 读 ， 束 像 (minute*100)/69 这 
样 ， 即 使 这 里 增加 括号 并 不 会 改变 结果 。 

。 乘 方 (E ，Exponentiation) 操作 拥有 次 高 的 优先 级 ， 所 以 1+2**3 
的 结果 是 9， 而 不 是 27， 而 且 2 * 3**2 的 结果 是 18， 而 不 是 36 。 

。 乘法 (M ，Moultiplication) 和 除法 (D ，Division) 优先 级 相同 ， 
并 且 高 于 亦 有 相同 优先 级 的 加 法 (A ，Addition) 和 减法 〈S ， 


Substraction) 。 所 以 2*3-1 是 5， 而 不 是 4， 并 且 6+4/2 是 8， 而 
不 是 5。 

。 优先 级 相同 的 操作 按照 自 左 同 右 的 顺序 求 值 (除了 乘 方 以 外 ) 。 
所 以 表达 式 degrees/2*pi ， 除 法 在 乘法 之 前 执行 ， 结 果 乘 以 pi 
。 如 果 想 除 以 2xn， 可 以 使 用 括号 ， 或 者 写 为 degrees/2/pi 。 


其 他 操作 符 的 优先 级 ， 我 并 不 会 伦 太 多 功夫 记 下 来 。 如 采 只 看 表 
达 式 不 能 确定 的 话 ， 使 用 括号 指明 优先 级 即 可 。 


2.6 ”字符 串 操作 


通 单 来 说 ， 字 符 串 不 能 进行 数学 操作 。 即 使 看 起 来 像 数 字 也 不 
行 。 下 面 的 操作 是 非法 的 : 


'eggs'/'easy' 'third'*'a charm' 


但 有 两 个 例外 : + 和 *。 


操作 符 + 进 行 字 符 串 拼接 (string concatenation) 操作 ， 意 即将 前 
后 两 个 字符 首尾 连接 起 来 。 例 如 : 


>>> first = 'throat' 
>>> second = 'warbler' 
>>> first + second 


throatwarbler 


操作 符 * 也 适用 于 字符 串 ， 它 进行 重复 操作 。 例 如 ，'Spam'*3 的 
结果 是 'SpamSpamSpam' 。 如 果 * 的 两 个 操作 对 象 之 一 是 字符 串 ， 那 


另 一 个 必须 是 整数 。， 


字符 串 的 + 和 * 的 应 用 ， 实 际 上 和 数字 的 加 法 与 乘法 类 似 。 就 像 4*3 
与 4+4+4 相等 一 样 ， 我 们 预期 ' Spam'*3 
与 'Spam'+'Spam'+'Spam' 也 相等 ， 实 际 也 确实 如 此 。 男 一 方面 ， 
字符 串 的 拼接 与 重复 操作 和 整数 的 加 法 与 乘法 操作 也 有 很 大 的 不 同 。 
你 能 够 想 出 加 法 的 一 个 属性 ， 字 符 串 拼接 操作 并 不 文 持 吗 ? 


2.7 ”注释 


当 程 序 变 得 更 大 更 复杂 时 ， 读 起 来 也 更 困难 。 形 式 语言 很 紧 竣 ， 
经 常会 遇 到 一 段 代 码 ， 却 很 难 弄 清 它 在 做 什么 、 为 什么 那么 做 。 


因此 ， 在 程序 中 加 入 目 然 语言 的 笔记 来 解释 程序 在 做 什么 ， 是 个 
好 主意 。 这 种 笔记 被 称 为 注释 (comments) ， 它 们 以 # 开头 : 


# compute the percentage of the hour that has elapsed 
percentage = (minute * 100) / 60 


在 这 个 例子 里 ， 注 释 单独 占据 一 行 。 也 可 以 把 注释 放 到 代码 行 的 


percentage = (minute * 100) / 60 # percentage of an hour 


从 # 开 始 到 行 尾 的 注释 内 容 都 会 被 解释 器 忽略 掉 一 一 它们 对 程序 本 
号 运行 没有 任何 影响 。 


注释 最 重要 的 用 途 在 于 解释 代码 并 不 显而易见 的 特性 。 我 们 可 以 
合理 地 认为 读者 可 以 看 懂 代 码 在 做 什么 ， 因 此 使 用 注释 来 解释 为 什么 
这 么 做 ， 要 有 用 得 多 。 


下 面 这 段 注 释 与 代码 重复 ， 坚 无 用 处 : 


v=5 # 将 5 赋值 给 v 


而 下 面 这 上 段 注 释 则 包 仿 了 代码 中 看 不 到 的 有 用 信息 : 


， 单 位 是 米 / 秒 


选择 好 的 变量 名 称 ， 可 以 减少 注释 的 需要 ， 但 长 名 字 也 会 让 复杂 
表达 式 更 难 阅读 ， 所 以 这 两 者 之 间 需 要 衡量 舍 取 。 


2.8 ”调试 


一 个 程序 中 可 能 出 现 3 种 错误 : 语法 错误 、 运 行 时 错误 和 语义 错 
误 。 对 它们 加 以 区 分 ， 可 以 更 快 地 找到 错误 。 


语法 错误 


语法 指 的 是 程序 的 结构 以 及 此 结构 的 规则 。 例 如 ， 括 号 必须 前 后 
匹配 ， 所 以 (1+2) 征 合 法 的 ， 而 8 ) 吏 是 一 个 语法 错误 。 


程序 中 只 要 出 现 一 处 语法 错误 ，Python 就 会 显示 出 错 消息 并 退出 ， 
你 的 程序 就 无 法 运行 了 。 在 编程 生涯 的 最 初 几 周 中 ， 可 能 会 需要 人 花费 


大 量 时 间 来 得 找 语法 错误 。 但 随 厦 经 难 的 增加 ， 犯 错 会 越 来 越 少 ， 
找 起 来 也 会 越 来 越 快 。 


运行 时 错误 


第 二 类 错误 是 运行 时 错误 ， 这 样 称 呼 是 因为 这 种 错误 只 有 程序 运 
行 后 才 会 出 现 。 这 些 错误 也 常 被 称 为 异常 (exception) ， 因 为 它们 常 
党 表示 某 些 异常 的 〈 而 且 不 好 的 ) 事情 发 生 了 。 


运行 时 错误 在 开头 几 章 中 的 简单 示例 里 很 少 会 出 现 ， 所 以 可 能 
过 一 段 时 间 你 才 会 过 到。 


语义 错误 


三 类 错误 是 语义 错误 ， 意 思 是 错误 与 舍 义 相关 。 如 采 你 的 程序 
中 有 en 程序 仍 会 成 功 运行 ， 而 不 会 产生 任何 出 错 消息 ， 
但 是 它 不 会 执行 正确 的 逻辑 。 它 会 做 其 他 的 事情 。 特 别 需 要 注意 的 
是 ， 它 所 做 的 正 是 你 的 代码 所 告诉 它 的 。 


查找 语义 错误 会 比较 麻烦 ， 因 为 需要 反 向 查找 ， 查 看 程序 输出 并 
尝试 型 明 白 它 到 底 做 了 什么 。 


2.9 术语 表 


变量 (variable) : 引用 一 个 值 的 名 字 。 


赋值 语句 (assignment statement) : 将 一 个 值 赋值 给 变量 的 语句 。 


状态 图 (state diagram) : 用 来 展示 一 些 变量 以 及 其 值 的 图 示 。 


关键 字 (keyword) : 编译 器 或 解释 器 保留 的 词 ， 用 于 解析 程序 ; 
变量 名 不 能 使 用 关键 字 ， 如 if ，def ，while 等 。 


操作 数 ”(operand) : 操作 符 所 操作 的 值 。 


表达 式 (expression) : 变量 、 操 作 符 和 值 的 组 合 ， 可 以 表示 一 个 
单独 的 结果 值 。 


求 值 (evaluate) : 对 表达 式 按 照 操 作 的 顺序 进行 计算 ， 求 得 其 结 
果 值 。 


语句 (statement) : 表示 一 个 命令 或 动作 的 一 段 代码 。 至 今 我 们 
见 过 赋值 语句 和 打印 语句 。 


执行 (execute) : 运行 一 条 语句 ， 看 它 说 的 是 什么 。 


交互 模式 (interactive mode) : 使 用 Python 解释 器 的 一 种 方式 ， 在 
是 示 和 从 之 后 键入 代码 。 


脚本 模式 (script mode) : 使 用 Python 解释 器 的 一 种 方式 ， 从 脚本 
中 读 入 代码 并 运行 它 。 


脚本 (scripb : 保存 在 文件 中 的 程序 。 


操作 顺序 (order of operations) : 当 表 达 式 中 有 多 个 操作 符 和 操作 
对 象 要 求 值 时 ， 用 于 指导 求 值 顺序 的 规则 。 


拼接 (concatenate) :将 两 个 操作 数 首尾 相连 。 


注释 (comment) : 代码 中 附加 的 注解 信息 ， 用 于 帮助 其 他 程序 
员 阅 读 代 码 ， 并 不 影响 程序 的 运行 。 


语法 错误 、(syntax error) : 程序 中 的 一 种 错误 ， 导 致 它 无 法 进行 
语法 解析 (因此 也 无 法 被 解释 器 执行 )。 


异常 (exception) : 程序 运行 中 发 现 的 错误 。 
语义 (semantics) : 程序 表达 的 含义 。 


语义 错误 (semantic error) : 程序 中 的 一 种 错误 ， 导 致 程序 所 做 
的 事情 不 是 程序 员 设 想 的 。 


2.10 ”练习 


hod 2-1 


重申 上 一 张 的 建议 ， 每 当 你 学 习 新 语言 特性 时 ， 都 应 当 在 交互 模 
式 中 进行 演 试 ， 并 故意 犯 下 错误 ， 看 会 有 哪些 问题 


。 我 们 已 经 见 过 n = 42 是 合法 的 。 那 么 42 = n 呢 ? 

。 那 和 = y = 工 呢 ? 

。 有 些 语言 中 ， 每 个 语句 都 需要 以 分 号 (;) 结尾 。 如 果 你 在 Python 
语句 的 结尾 放 一 个 分 号 ， 会 有 什么 情况 ? 

。 如 果 在 语句 结尾 放 的 是 句号 呢 ? 

。 在 数学 标记 中 ， 对 于 x 乘 以 y ， 可 以 这 么 表达 : xy “。 在 Python 中 
这 样 党 试 会 有 什么 结果 ? 


练习 2-2 
把 Python 解释 器 当 作 计算 需 来 进行 练习 。 


1. 半径 为 r 的 球体 的 体积 是 (4/3)rr3。 半 径 为 5 的 球体 体积 是 多 


少 ? 


2. 假设 一 本 书 的 定价 是 24.95 美 元 ， 但 是 书店 打 了 40% 的 折扣 (6 
折 ) 。 运 费 是 一 本 3 美元 ， 每 加 一 本 加 75 美 分 。60 本 书 的 总 价 是 多 少 ? 


3， 如 果 我 6:52 时 离开 家 ， 并 以 慢 速 (6 分 10 秒 / 千 米 ) 跑 1.6 千 米 ， 
接 下 来 以 4 分 30 秒 / 千 米 的 速度 跑 4.8 千 米 ， 再 以 慢 速 跑 1.6 千 米 。 请 问 我 
回 家 吃 早餐 是 什么 时 候 ? 


第 3 章 ”函数 


在 程序 设计 中 ， 画 数 是 指 用 于 进行 某 种 计算 的 一 系列 语句 的 有 名 
称 的 组 合 。 定 义 一 个 函数 时 ， 需 要 指定 函数 的 名 称 并 写 下 一 系列 程序 
语句 。 之 后 ， 束 可 以 使 用 名 称 来 “调用 ”这 个 函数 。 


3.1 ”图 数 调 用 


前 面 我 们 已 经 见 过 函数 调用 的 一 个 例子 : 


>>> type(42) 
<class 'int'> 


这 个 画 数 的 名 称 是 type ， 括 号 中 的 表达 式 我 们 称 之 为 画 数 的 参数 
这 个 画 数 调用 的 结果 是 求 得 参数 的 类 型 。 


我 们 通 第 说 钞 数 “接收 ”参数 ， 并 “返回 ”结果 。 这 个 结果 也 称 为 返回 


值 (return value) 。 


Python 提 供 了 一 些 可 将 某 个 值 从 一 种 类 型 转换 为 妨 一 种 类 型 的 范 
数 。int 函 数 可 以 把 任何 可 以 转换 为 整 型 的 值 转换 为 整 型 ， 如 有 果 转 换 
失败 ， 则 会 报错 : 
>>> int('32') 


32 
>>> int('Hello') 


ValueError: invalid literal for int(): Hello 


int 可 以 将 浮 点 数 转换 为 整数 ， 但 不 会 做 四 售 五 入 操作 ， 而 是 直 
接 舍 弃 小 数 部 分 。 


>>> int(3.99999) 


3 
>>> int(-2.3) 
-2 


float 函数 将 整数 和 字符 串 转 换 为 浮 点 数 : 


>>> float(32) 
32 .0 


>>> float('3.14159') 
3.14159 


最 后 ，Str 函数 将 参数 转换 为 字符 串 : 


>>> Str(32) 
1 


2 1 


>>> str(3.14159) 


'3.14159' 


3.2 ”数学 函数 


Python 有 一 个 数学 计算 模块 ， 提 供 了 大 多 数 常用 的 数学 函数 。 模 块 
(module) 是 指 包含 一 组 相关 的 函数 的 文件 。 


要 想 使 用 模块 中 的 函数 ， 需 要 先 使 用 import 语句 将 它 导入 运行 环 


境 : 


>>> Import math 


这 个 语句 将 会 创建 一 个 名 为 math 的 模块 对 象 (module object) 。 
如 果 显 示 这 个 对 象 ， 可 以 看 到 它 的 一 些 信息 


>>> math 
<module 'math' (built-in)> 


模块 对 象 包含 了 该 模块 中 定义 的 函数 和 变量 。 若 要 访问 其 中 的 一 
个 函数 ， 需 要 同时 指定 模块 名 称 和 函数 名 称 ， 用 一 个 句点 (.) 分 隔 。 
这 个 格式 称 为 句点 表示 法 (dot notation) 。 


>>> ratio = signal power / noise_power 
>>> decibels = 10 * math.10g10(ratio) 


>>> radians = 0.7 
>>> height = math.sin(radians) 


上 面 第 一 个 例子 使 用 了 math ,1og10 来 计算 以 分 贝 为 单位 的 信号 / 
噪声 比 〈 假 设 Signal_power 和 noise_power 都 已 经 事先 定义 好 
了 ) 。math 模块 也 提供 了 1og 函数 ， 用 来 计算 底 为 e 的 自然 对 数 。 


二 个 例子 计算 radians 的 正弦 值 。 这 个 变量 名 已 经 暗示 了 ， 
sin es \ tan 等 三 角 函 数 接受 的 参数 是 以 弧度 (radians) 为 单 
位 的 。 若 要 将 角度 转换 为 弧度 ， 可 以 除 以 180 再 乘 以 nt: 


>>> degrees = 45 
>>> radians = degrees / 180.0 * math.pi 
>>> math.sin(radians) 


0.707106781187 


表达 式 math.pi 从 math 模块 中 获得 变量 pi 。 这 个 变量 的 值 是 n 
的 浮 点 近似 值 ， 大 约 精 确 到 15 位 数字 。 


如 条 了 解 三 角 函 数 ， 可 以 把 上 面 的 结 末 和 2 的 平方 根 的 一 半 进 行 比 


较 : 


>>> math.sqrt(2) / 2.0 
0.707106781187 


3.3” ”组合 


到 现在 为 止 ， 我 们 已 经 分 别 了 解 了 程序 的 基本 元 素 一 一 变量 、 表 
达 式 和 语句 ， 但 还 没有 接触 如 何 将 它们 有 机 地 组 合 起 来 。 
程序 设计 语言 最 有 用 的 特性 之 一 就 是 可 以 将 各 种 小 的 构建 块 
(building block) 组 合 起 来 。 例 如 ， 画 数 的 参数 可 以 是 任何 类 型 的 表 
达 式 ， 包 括 算术 操作 从: 


x = math.sin(degrees / 360.0 * 2 * math.pi) 
甚至 还 包括 函数 调用 : 


x = math.exp(math.1log(x+1)) 


基本 上 ， 在 任何 可 以 使 用 值 的 地 方 ， 都 可 以 使 用 任意 表达 式 ， 只 
有 一 个 例外 : 赋值 表达 陈 的 东边 必须 是 变量 名 称 ， 在 左边 放置 任何 其 
他 的 表达 式 虱 是 语法 错 座 《后面 我 们 还 会 看 到 这 条 规则 的 例外 情 

We) 


>>> minutes = hours * 60 # 
>>> hours * 60 = minutes # 错误 ! 
SyntaxError: can't assign to operator 


3.4 ”添加 新 图 数 


至 此 ， 我 们 都 只 是 在 使 用 Python 控 供 的 男 数 ， 其 实 我 们 也 可 以 目 己 
添加 新 的 函数 。 画 数 定义 指定 新 函数 的 名 称 ， 并 提供 一 系列 程序 语 
句 ， 当 画 数 被 调用 时 ， 这 些 语 句 会 顺序 运行 。 

下 面 是 一 个 例子 : 


def print_lyrics(): 
print ("I'm a lumberjack, and I'm okay.") 


print ("I sleep all night and I work all day.") 


def 走 关 键 字 ， 表 示 搂 下 来 是 一 个 瑟 数 定 义 。 这 个 函数 的 名 称 是 
print_lyrics。 函 数 名 称 的 书写 规则 和 变量 名 称 一 样 ， 字母 、 数 字 
和 下 划 线 和 是 合法 的 ， 但 第 一 个 字符 不 能 是 数字 。 关 键 字 不 能 作为 函数 
名 ， 而 且 我 们 应 尽量 避免 函数 和 变量 同名 。 


函数 名 后 的 空 括号 表示 它 不 接收 任何 参数 。 


函数 定义 的 第 一 行 称 为 函数 头 《header) ， 其 他 部 分 称 为 函数 体 
(body) 。 芳 数 尖 应 该 以 冒号 结束 ， 函 数 体 则 应 当 整 体 缩 进 一 级 。 依 
照 惯例 ， 缩 进 总 是 使 用 4 个 空格 ， 画 数 体 的 代码 语句 行 数 不 限 。 


本 例 中 print 语句 里 的 字符 串 使 用 双 引 号 括 起 来 。 单 引号 和 双 引 
号 的 作用 相同 。 大 部 分 情况 下 ， 人 们 都 使 用 单 引号 ， 只 在 本 例 中 这 样 
的 特殊 情况 下 才 使 用 双 引 号 。 本 例 中 的 字符 串 里 本 吴 殉 存在 单 引号 
(这 里 的 单 引 号 作为 缩 略 符号 用 ) 。 


代码 中 所 有 的 引号 (包括 双 引 号 和 单 引 号 都 必须 是 * 直 引号 ”， 
通 肖 在 键盘 上 的 Enter 刍 附近。 而 “和 斜 引 号 ”"， 在 Python 中 古 非法 的 。 


如 采 在 交互 模式 里 输入 函数 定义 ， 则 解释 器 会 输出 省 略 号 (.. . 
) 提示 用 户 当前 的 定义 还 没有 结束 : 


>>> def print_lyrics(): 
print("I'm a lumberjack, and I'm okay.") 
print("I sleep all night and I work all day.") 


[ee 


要 结束 这 个 函数 的 定义 ， 需 要 输入 一 个 空 行 。 
定义 一 个 函数 会 创建 一 个 函数 对 象 ， 其 类 型 是 'function' 。 


>>> print(print_lyrics) 

<function print_lyrics at Oxb7e99eg9c> 
>>> type(print_lyrics) 

<class 'function'> 


调用 新 创建 的 函数 的 方式 ， 与 调用 内 置 函 数 是 一 样 的 : 


>>> print_lyrics() 
I'm a lumberjack, and I'm okay. 
I sleep all night and I work all day. 


定义 好 一 个 函数 之 后 ， 就 可 以 在 其 他 范 数 中 调用 它 。 例 如 ， 若 想 
重复 上 面 的 歌词 ， 我 们 可 以 写 一 个 repeat_lyrics 函数 : 


def repeat_lyrics(): 
print_lyrics() 


print_lyrics() 


然后 可 以 调用 repeat_lyrics : 


>>> repeat_lyrics() 

I'm a lumberjack, and I'm okay. 

I sleep all night and I work all day. 
I'm a lumberjack, and I'm okay. 


I sleep all night and I work all day. 


3.5 ”定义 和 使 用 


将 前 面 一 届 的 代码 片段 整合 起 来 ， 整 个 程序 就 像 下 面 这 个 样子 : 


def print_lyrics(): 
print("I'm a lumberjack, and I'm okay.") 
print("I Sleep all night and I work all day.") 


def repeat_lyrics(): 
print_lyrics() 
print_lyrics() 


repeat_lyrics() 


这 个 程序 包含 两 个 芳 数 定义 ，print_lyrics 和 
repeat_lyrics。 琅 数 定 义 的 执行 方式 和 其 他 语句 一 样 ， 不 同 的 是 
执行 后 会 创建 画 数 对 象 。 画 数 体 里 面 的 语句 并 不 会 立即 运行 ， 而 是 等 
到 函数 被 调用 时 才 执 行 。 函 数 定义 不 会 产生 任何 输出 。 


你 可 能 已 经 猜 到 ， 必 须 先 创 建 一 个 画 数 ， 才 能 运行 它 。 换 言 之 ， 
画 数 定义 必须 在 画 数 被 调用 之 前 先 运行 。 


作为 练习 ， 将 程序 的 最 后 一 行 移动 到 首 行 ， 于 是 函数 调用 会 爷 于 
函数 定义 执行 。 运 行程 序 并 得 看 会 有 什么 样 的 错误 信息 


O 


现在 将 函数 调用 那 一 行 放 回 到 末尾 ， 并 将 函数 print_lyrics 的 
定义 移 到 函数 repeat_1Lyrics 定义 之 后 。 这 时 候 运 行程 序 会 发 生 什 
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3.6 ”执行 流程 


为 了 保证 函数 的 定义 先 于 其 首次 调用 执行 ， 需 要 知道 程序 中 语句 
运行 的 顺序 ， 即 执行 流程 。 


执行 总 是 从 程序 的 第 一 行 开 始 。 语 句 按 照 从 上 到 下 的 顺序 逐一 运 


画 数 定义 并 不 会 改变 程序 的 执行 流程 ， 但 应 注意 画 数 体 中 的 语句 
并 不 立即 运行 ， 而 是 等 到 画 数 被 调用 时 运行 。 


函数 调用 可 以 看 作 程 序 运 行 流程 中 的 一 个 迁 回路 径 。 遇 到 函数 调 
用 时 ， 并 不 会 直接 继续 运行 下 一 条 语句 ， 而 是 跳 到 函数 体 的 第 一 行 ， 
继续 运行 完 男 数 体 的 所 有 语句 ， 再 跳 回 到 原来 离开 的 地 方 。 


这 样 看 似 简 单 ， 但 马上 你 束 会 发 现 ， 画 数 体 中 可 以 调用 其 他 画 


语句 。 而 后 ， 当 运行 那个 函数 中 的 语句 时 ， 又 可 能 再 需要 调用 运行 另 
一 个 国 数 的 语句 ! 


幸好 Python 对 于 它 运行 到 哪里 有 很 好 的 记录 ， 所 以 每 个 画 数 执行 结 
束 后 ， 程 序 都 能 跳 回 到 它 离 开 的 地 方 。 直 到 执行 到 整个 程序 的 结尾 ， 
才 会 结束 程序 。 


总 之 ， 在 阅读 代码 时 ， 并 不 总 应 该 按照 代码 书写 顺序 一 行 行 阅 
读 ， 有 时 候 ， 按 照 程序 执行 的 流程 来 阅读 代码 ， 理 解 的 效果 可 能 会 更 
全 


3.7“ 形 参 和 实 参 出 


前 面 说 到 的 函数 有 些 需要 传 入 参数 外。 例如 ， 当 调用 math .sin 
时 ， 需 要 传 入 一 个 数字 作为 实 参 。 有 的 函数 需要 多 个 实 参 : math .pow 
需要 两 个 ， 分 别 是 基数 (base) 和 指数 (exponent) 


在 函数 内 部 ， 实 参 会 赋值 给 称 为 形 参 (parameter) 的 变量 。 下 面 
的 例子 是 一 个 函 数 的 定义 ， 接 收 一 个 实 参 : 


def print_twice(bruce ) : 
print(bruce) 
print(bruce) 


这 个 函数 在 调用 时 会 把 实 参 的 值 赋 到 形 参 bruce 上 ， 并 将 其 打印 


这 个 函数 对 任何 可 以 打印 的 值 都 可 用 。 


当 


>>> print_twice(42) 
42 


42 
>>> print_twice(math.pi) 
3.14159265359 


3.14159265359 


内 区 了 画 数 的 组 合 规则 ， 在 用 户 目 定义 男 ma 所 以 我 
们 可 以 对 print_twice 使 用 任何 表达 式 作为 实 


>>> print_ twice('Spam '*4) 

Spam Spam Spam Spam 

Spam Spam Spam Spam 

>>> print_twice(math.cos(math.pi)) 
-1.0 

-1.0 


作为 实 参 的 表达 式 会 在 函数 调用 之 前 先 执行 。 所 以 在 这 个 例子 
中 ， 表 达 式 'Spam '*4 和 math .cos(math.pi) 都 只 执行 一 次 。 


也 可 以 使 用 变量 作为 实 


>>> michael = 'Eric, the half a bee.' 
>>> print_ twice(michael) 
Eric, the half a bee. 


Eric, the half a bee. 


作为 实 参 传 入 到 函数 的 变量 的 名 称 (michael ) 和 函数 定义 里 形 
参 的 名 称 (bruce ) 没有 关系 。 男 数 内 部 只 关心 形 参 的 值 ， 而 不 用 关 
心 它 在 调用 前 叫 什 么 名 字 ; 在 print_twice 函数 内 部 ， 大 家 都 叫 


bruce 。 


3.8 ”变量 和 形 参 是 局 部 的 


在 函数 体内 新 建 一 个 变量 时 ， 这 个 变量 是 局 部 的 〈local) ， 即 它 
只 存在 于 这 个 函数 之 内 。 例 如 ; 


def cat_twice(part1，part2): 
cat = part1 + part2 


print_twice(cat ) 


这 个 函数 授 收 两 个 实 参 ， 将 它们 拼接 起 来 ， 并 将 结果 打印 两 汕 。 
下 面 古 一 个 使 用 这 一 函数 的 例子 : 
>>> linel "Bing tiddle ' 


>>> line2 = 'tiddle bang.' 
>>> cat_twice(line1, line2) 


Bing tiddle tiddle bang. 
Bing tiddle tiddle bang. 


当 cat_twice 结束 时 ， 变 量 cat 会 被 销毁 。 这 时 再 尝试 打 印 它 的 


话 ， 会 得 到 一 个 异常 : 


>>> print(cat) 
NameError: name 'cat' is not defined 


形 参 也 是 局 部 的 。 例 如 ， 在 print_twice 函数 之 外 ， 不 存在 


bruce 这 个 变量 。 


3.9 ” 栈 图 


要 跟踪 哪些 变量 在 哪些 地 方 使 用 ， 有 了 时候 画 一 个 栈 图 (stack 
diagram) 会 很 方便 。 和 状态 图 一 样 ， 栈 图 可 以 展示 每 个 变量 的 值 ， 不 
同 的 是 它 会 展示 每 个 变量 所 属 的 芳 数 。 


每 个 函数 使 用 一 个 帧 包含 ， 帧 在 栈 图 中 就 是 一 个 带 着 画 数 名 称 的 
盒 了 于 ， 里 面 有 辑 数 的 参数 和 变量 。 前 面 的 钞 数 示例 的 栈 图 如 图 3-1 所 
i 


| line1 一 ‘Bing tiddle 
__ main . 
line2 一 = ‘tiddle bang. 


part1 —= ‘Bing tiddle ° 


cat twice | part2 一 = ‘tiddle bang. 


cat 一 Bing tiddle tiddle bang.’ 


print_twice | bruce 一 = ‘Bing tiddle tiddle bang.’ 


图 3-1 栈 图 


图 中 各 个 帧 从 上 到 下 安排 成 一 个 栈 ， 能 够 展示 出 哪个 函数 被 哪个 
函数 调用 了 。 在 这 个 例子 里 ，print_twice 被 cat_twice 调用 ， 而 
cat_twice 被 ”main 调用。 _ main _ 是 用 于 表示 整个 栈 图 的 图 
框 的 特别 名 称 。 在 所 有 函数 之 外 新 建 变 量 时 ， 它 就 是 属于 _main__- 
的 。 


每 个 形 参 都 指 回 与 其 对 应 的 实 参 相同 的 值 ， 所 以 ，part1 和 
linel 的 值 相同 ，part2 和 1Line2 的 值 相同 ， 而 bruce 和 cat 的 值 
相同 。 


如 果 调 用 函数 的 过 程 中 发 生 了 错误 ，Python 会 打印 出 函数 名 、 调 用 
它 的 范 数 的 名 称 ， 以 及 调用 这 个 调用 着 的 函数 名 ， 依 此 类 推 , 一 直到 


main 。 


例如 ， 如 果 在 print_twice 中 访问 cat 变量 ， 则 会 得 到 一 个 


NameError : 


Traceback (innermost last): 
File "test.py", line 13, in _ main _ 
cat_twice(line1i, line2) 
File "test.py", line 5, in cat_twice 
print_twice(cat) 


File "test.py", line 9, in print_twice 
print cat 
NameError: name 'cat' is not defined 


上 面 这 个 函数 列表 被 称 为 回溯 (traceback) 。 它 告诉 你 错误 出 现 
在 哪个 程序 文件 ， 哪 一 行 ， 以 及 哪些 函数 正在 运行 。 它 也 会 显示 导致 
鲁 误 的 那 一 行 代码 。 


回溯 中 画 数 的 顺序 和 栈 图 中 图 框 的 顺序 一 尾 。 当 前 正在 执行 的 函 
数 在 最 奈 部 。 


3.10 有 返回 值 本 数 和 无 返回 值 国 数 


在 我 们 使 用 过 的 函数 中 ， 有 一 部 分 畏 数 ， 如 数学 函数 ， 会 返回 结 
果 。 因 为 没有 想到 更 好 的 名 字 ， 我 称 这 类 画 数 为 有 返回 值 档 数 
(fruitful function) 。 另 一 些 函 数 ， 如 print_twice ， 会 执行 一 个 动 
作 ， 但 不 返回 任何 值 。 我 们 称 这 类 画 数 为 无 返回 值 画 数 〈void 


function) 


当 调用 一 个 有 返回 值 的 函数 时 ， 大 部 分 情况 下 你 都 想 要 对 结 采 做 
某 种 操作 。 例 如 ， 你 可 能 会 想 把 它 赋值 给 一 个 变量 ， 或 者 用 在 一 个 表 
I 


x = math.cos(radians) 
golden = (math.sqrt(5) + 1) / 2 


在 交互 模式 中 调用 函数 时 ，Python 会 直接 显示 结 采 : 


>>> math.sqrt(5) 
2.2360679774997898 


但 古 在 脚本 中 ， 如 果 只 是 直接 调用 这 类 函数 ， 那 么 它 的 返回 值 束 
会 永远 丢失 卸 ! 


math. sqrt(5) 


这 个 脚本 计算 5 的 平方 根 ， 但 由 于 并 没有 把 计算 结果 存储 到 某 个 变 
量 中 ， 或 显示 出 来 ， 所 以 其 实 没 什么 实际 作用 。 


无 返回 值 函 数 可 能 在 屏幕 上 显示 某 些 东西 ， 或 者 有 其 他 的 效果 ， 
但 是 它们 没有 返回 值 。 如 果 把 该 结果 赋值 给 革 个 变量 ， 则 会 得 到 一 个 
特殊 的 值 None 。 


>>> result = print_twice('Bing') 
Bing 


>>> print result 
None 


值 None 和 字符 串 ' None ' 并 不 一 样 。 它 是 一 个 特殊 的 值 ， 有 目 己 
独特 的 类 型 : 


>>> print type(None ) 
<class 'NoneType'> 


到 目前 为 止 ， 我们 自 定义 的 画 数 都 是 无 返回 值 画 数 。 再 过 几 童 我 
们 就 会 开始 写 有 返回 值 的 画 数 了 。 


3.11 为 什么 要 有 画 数 


为 什么 要 人 花 功 夫 将 程序 拆 分 成 范 数 呢 ? 也 许 刚 开始 编程 的 时 候 这 
其 中 的 原因 并 不 明晰 。 下 面 这 些 解释 都 可 作为 参考 。 


。 新 建 一 个 函数 ， 可 以 让 你 有 机 会 给 一 组 语句 命名 ， 这 样 可 以 让 代 
码 更 易 读 和 更 易 调 试 。 

。 函数 可 以 通过 减少 重复 代码 使 程序 更 短小 。 后 面 如 果 需 要 修改 代 
码 ， 也 只 要 修改 一 个 地 方 即 可 。 

。 将 一 长 段 程序 拆 分 成 几 个 函数 后 ， 可 以 对 每 一 个 函数 单独 进行 调 
试 ， 再 将 它们 组 疼 起 来 成 为 完整 的 产品 。 

。 一 个 设计 腿 好 的 函数 ， 可 以 在 很 多 程序 中 使 用 。 书 写 一 次 ， 调 试 
至 八 ， 生 用 和 ， 


3.12 ”调试 


你 将 会 营 握 的 一 个 最 重要 的 技能 束 是 调试 。 虽 然 调试 可 能 时 有 烦 
恼 ， 但 它 的 确 是 编程 活动 中 最 耗 脑力 、 最 有 挑战 、 最 有 趣 的 部 分 。 


在 某 种 程度 上 ， 调 试 和 刑侦 工作 很 像 。 你 会 面 对 一 些 线索 ， 而 且 
必须 推导 出 事情 发 生 的 过 程 ， 以 及 导致 现场 结果 的 事件 。 


调试 也 像 是 一 种 实验 科学 。 一 旦 猜 出 错误 的 可 能 原因 ， 束 可 以 修 
改 程序 ， 再 运行 一 次 。 如 果 猜 对 了 ， 那 么 程序 的 运行 结果 会 符合 预 
测 ， 这 样 瓯 离 正 确 的 程序 更 近 了 一 步 。 如 采 猜 错 了 ， 则 需要 重新 思 
考 。 正 如 夏 洛克 :福尔摩斯 所 说 的 : “ 当 你 排除 掉 所 有 的 可 能 性 ， 那 么 剩 
下 的， 不管 多 么 不 可 能 ， 必 定 是 真相 。” (柯南 : 道 尔 《四 签名 》) 


对 某 些 人 来 说 ， 编 程 和 调试 是 同一 件 事 。 也 束 是 说 ， 编 程 正 是 不 
断 调试 修改 直到 程序 达到 设计 目的 的 过 程 。 这 种 想法 的 要 由 是， 应 该 
从 一 个 能 做 某 些 事 的 程序 开始 ， 然 后 做 一 点 点 修改 ， 并 调试 修改 ， 如 
此 迭 代 ， 以 确保 总 是 有 一 个 可 以 运行 的 程序 。 


例如 ，Linux 是 包含 了 数 百 万 行 代码 的 操作 系统 ， 但 最 开始 只 是 
Linus Torvalds 编 写 的 用 来 研究 Intel 80386 心 片 的 简单 程序 。 据 Larry 


Greenfield 所 说 : “Linus 最 早 的 一 个 程序 是 交 蔡 打印 AAAA 和 BBBB。 后 
来 这 些 程序 演化 成 了 Linux。”(《Linux 用 户 指 南 》Beta 版 本 1) 


3.13 ”术语 表 


函数 ”(function) : 一 个 有 名 称 的 语句 序列 ， 可 以 进行 某 种 有 用 的 
操作 。 男 数 可 以 接收 或 者 不 接收 参数 ， 可 以 返回 或 不 返回 结 


函数 定义 (function definition) : 一 个 用 来 创建 新 函数 的 语句 ， 指 
定 函 数 的 名 称 、 参 数 以 及 它 包 含 的 语句 序列 。 


函数 对 象 〈function object) : 函数 定义 所 创建 的 值 。 画 数 名 可 以 
用 作 变 量 来 引用 一 个 函数 对 象 。 


函数 头 ”(header) : 男 数 定义 的 第 一 行 。 
函数 体 (body) : 函数 定义 内 的 语句 序列 。 


形 参 (parameter) : 函数 内 使 用 的 用 来 引用 作为 实 参 传 入 的 值 的 
名 称 。 


函数 调用 (function call) : 运行 一 个 函数 的 语句 。 它 由 函数 名 称 
和 括号 中 的 参数 列表 组 成 。 


实 参 (argument) : 当 画 数 调用 时 ， 提 供给 它 的 值 。 这 个 值 会 被 
赋值 给 对 应 的 形 参 。 


局 部 变量 (local variable) : 函数 内 定义 的 变量 。 局 部 变量 只 能 在 
函数 体内 使 用 。 


返回 值 (return value) : 范 数 的 结果 。 如 果 画 数 被 当 作 表 达 式 调 
用 ， 返 回 值 就 是 表达 式 的 值 。 


有 返回 值 画 数 (fruitful function) : 返回 一 个 值 的 函数 。 
无 返回 值 画 数 (void function) : 总 是 返回 None 的 函数 。 
None: 由 无 返回 值 画 数 返回 的 一 个 特殊 值 。 


模块 (module) : 一 个 包含 相关 函数 以 及 其 他 定义 的 集合 的 文 


import 语 句 ”(import statement) : 读 入 一 个 模块 文件 ， 并 创建 一 个 
模块 对 象 的 语句 。 


模块 对 象 (module object) : 使 用 import 语句 时 创建 的 对 象 ， 提 
供 对 模块 中 定义 的 值 的 访问 。 


人 句点 表示 法 (dot notation) : 调用 另 一 个 模块 中 的 函数 的 语法 ， 
使 用 模块 名 加 上 一 个 句点 符号 ， 再 加 上 函数 名 。 


组 合 (composition) : 使 用 一 个 表达 式 作 为 更 大 的 表达 式 的 一 部 
分 ,或 者 使 用 语句 作为 更 大 的 语句 的 一 部 分 。 


执行 流程 (flow of execution) : 语句 运行 的 顺序 。 


栈 图 (stack diagram) : 画 数 栈 的 图 形 表达 形式 ， 也 展示 它们 的 变 
量 ， 以 及 这 些 变量 引用 的 值 。 


图 框 (frame) ， 栈 图 中 的 一 个 图 框 ， 表 达 一 个 画 数 调用 。 它 包含 
了 局 部 变量 以 及 画 数 的 参数 。 


回调 (traceback) : 当 异 常 发 生 时 ， 打 印 出 正在 执行 的 函数 栈 。 
3.14 练习 


AM :33-1 


编写 一 个 函数 right_justify ， 接 收 一 个 字符 串 形 参 s ， 并 打 
印 出 足够 的 前 导 空 日 ， 以 达到 最 后 一 个 字符 显示 在 第 70 列 上 。 


>>> right_justify( monty ' ) 
monty 


提示 : 可 以 利用 字符 串 的 拼接 和 重复 特性 。 另 外 ，Python 提 供 了 一 
个 内 置 名 为 len 的 函数 ， 返 回 一 个 字符 串 的 长 度 ， 所 以 
len('allen') 的 值 是 5。 


AM 3-2 


函数 对 象 是 一 个 值 ， 可 以 将 它 赋值 给 变量 ， 或 者 作为 实 参 传递 。 
例如 ，do_twice 是 一 个 函数 ， 接 收 一 个 函数 对 象 作 为 实 参 ， 并 调用 
它 两 次 : 


def do_twice(f): 
f() 


f() 


下 面 是 一 个 使 用 do_twice 来 调用 一 个 print_spanm 函数 两 次 的 
示例 : 


def print_spam(): 
print('spam') 


do_twice(print_spam) 


1.， 将 这 个 示例 存 入 脚本 中 并 测试 它 。 


2. 修改 do_twice ， 证 它 接 收 两 个 实 参 ， 一 个 是 函数 对 象 ， 另 一 
个 是 一 个 值 ， 它 会 调用 函数 对 象 两 次 ， 并 传 入 那个 值 作为 实 参 。 


3. 将 本 章 前 面 介绍 的 函数 print_twice 的 定义 复制 到 你 的 脚本 


-二 


4. 使 用 修改 版 的 do_twice 来 调用 print_twice 两 次 ， 并 传 入 


实 参 'spam' 。 


5， 定义 一 个 新 的 函数 do_four ， 人 一 个 函数 对 象 与 一 个 值 ， 
使 用 这 个 值 作为 实 参 调 用 函数 4 次 。 这 个 函 数 的 函数 体 应 该 只 有 2 条 语 
句 ， 而 不 是 4 条 。 


解答 : http://thinkpython2.com/code/do_four.py ° 
练习 3-3 


注意 : 这 个 练习 应 该 只 用 语句 和 我 们 已 经 学 过 的 其 他 语言 特性 实 
现 。 


1. 编写 一 个 函数 ， 绘 制 如 下 的 表格 : 


状 二 和 


+ 

中 mm mm mm 小 = 
' 
十 


+---- -+ 


提示 : 要 在 同一 行 打印 多 个 值 ， 可 以 使 用 逗号 分 隔 不 同 的 值 : 


上 默认 情况 下 ，Print 会 日 动 换 行 ， 如 来 你 想 改变 这 一 行为 ， 在 结 
尾 打 印 一 个 空格 ， 可 以 这 样 做 : 


这 两 条 语句 的 输出 是 '+ -'。 


不 市 参数 的 print 语句 会 结束 当前 行 并 开始 下 一 行 。 
.编写 一 个 函数 绘制 类 似 的 表格 ,但 有 4 行 4 列 。 


解答 : http://thinkpython2.com/code/grid.py。 吗 谢 : 这 个 练习 基于 
Oualline 的 《实践 Cc 编程 》 第 3 版 (O'Reilly Media，1997) 中 的 一 个 示 
例 。 


pe sl 
调用 函数 时 传 入 的 实 参 (argument)” ， 这 里 两 种 是 有 区 分 的 。 一 一 译 者 
注 


[2] 调用 时 传 入 的 参数 称 为 实 参 (argument) 。 一 一 译 者 注 


第 4 章 “案例 研究 ;接口 设计 


本 章 通过 一 个 案例 研究 来 展示 设计 互相 配合 的 函数 的 过 程 。 


本 章 介绍 turt1le 模块 ， 通 过 这 个 模块 可 以 使 用 乌龟 图 形 来 创造 图 
像 。 大 多 数 Python 安 淡 包 里 都 包含 了 turtle 模块 ， 但 是 如 末 使 用 的 是 
PythonAnywhere， 则 不 能 直接 运行 马 包 示例 (至 少 在 我 写本 这 本 书 的 
时 候 还 不 行 ) 


如 果 你 已 经 在 电脑 上 安装 了 Python， 应 该 可 以 运行 本 章 的 示例 。 否 
则 ， 现 在 就 是 安装 Python 的 好 时 机 。 我 在 
http://tinyurl.com/thinkpython2e 上 写 了 安装 指责。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/polygon.py 下 
载 o 


4.1 turtle 模块 


要 检查 是 否 已 经 安装 了 turtle 模块 ， 可 以 打开 Python 解释 器 并 在 


>>> Import turtle 
>>> bob = turtle.Turtle() 


运行 这 段 代 码 时 ， 应 该 会 创建 一 个 者 窗口 ， 里 面 有 一 个 小 箭头 代 
表 马 龟 。 请 关闭 窗口 。 


创建 一 个 文件 nypolygon .py ， 并 输入 如 下 代码 ; 


import tutle 
bob = turtle.Turtle() 


print(bob) 
turtle.mainloop() 


turtle 模块 《以 小 写 t 开 头 ) 提供 一 个 叫 作 Turtle 的 函数 (以 
大 写 T 开 头 ) ， 它 会 创建 一 个 Turtle 对 象 ， 我 们 将 其 赋值 到 bob 变量 。 
打印 bob 会 得 到 类 似 下 面 的 输出 : 


<turtle.Turtle object at Oxb7bfbf4c> 


这 意味 着 bob 变量 引用 着 在 turle 模块 中 定义 的 Turtle 类 型 的 
一 个 对 象 。 

main1oop 告诉 窗口 去 等 待 用 户 进行 某 些 操作 ， 虽 然 现在 除了 关 
闭 窗口 之 外 ， 并 没有 提供 给 用 户 多 少 有 用 的 操作 。 

创建 好 一 个 乌 多 Ture) 之 后 ， 就 可 以 调用 它 的 一 个 方法 


(method) 来 在 窗口 中 移动 。 方 法 和 画 数 类 似 ， 但 是 使 用 的 语法 略 有 
不 同 。 例 如 ， 要 让 乌龟 向 前 移动 : 


bob .fd(100) 


这 个 方法 fd 和 我 们 称 为 bob 的 马 鱼 对 象 是 关联 的 。 调 用 方法 和 发 
出 一 个 请 求 类 似 : 你 是 在 请 求 bob 去 同 前 移动 。 


fd 的 参数 是 移动 的 距离 ， 以 像素 (pixel) 为 单位 ， 所 以 实际 移动 
的 距离 依赖 于 显示 器 的 分 辩 率 。 


Turtle 对 象 的 其 他 方法 包括 bk ( 用 于 前 进 和 后 退 ) 、1t 和 rt (用 
于 左 转 和 右 转 ) 。1t 和 rt 的 参数 是 旋转 的 角度 ， 单 位 是 度 。 


另外 ， 每 只 马 色 都 拿 痢 一 只 笔 ， 可 以 朝 上 或 者 划 下 ; 寿 笔 朝 下 ， 
则 会 绘制 出 走 过 的 路 迹 。 方 法 pu 和 pd 分 别 表 示 “ 笔 朝 上 ” (pen up) 
和 “ 笔 朝 下 ” (pen down) 。 


若 要 男 一 个 朝 右 的 角 ， 在 程序 中 (建立 bob 实例 之 后 ， 调 用 
mainloop 之 前 ) 添加 如 下 代码 : 


bob.fd(100) 
bob.1t (90) 
bob.fd(100) 


运行 这 个 程序 时 ， 将 会 看 到 bob 先 向 东 走 ， 再 向 北 走 ， 喘 后 留 下 
两 条 线段 。 


现在 试 着 修改 程序 ， 画 出 一 个 正方 形 来 。 在 成 功 之 前 请 不 要 继 


4.2 简单 重复 


你 可 能 会 写 下 如 下 代码 : 


bob.fd(100) 
bob.1t(90) 


bob .fd(100) 
bob.1t(90) 


bob .fd(100) 
bob.1t(90) 


bob .fd(100) 


使 用 for 语句 ， 可 以 更 紧 凌 地 实现 同样 功能 。 把 下 面 的 例子 加 到 
mypolygon.py 中 ， 并 再 运行 一 次 : 


for i in range(4): 
print('Hello!') 


可 能 会 看 到 如 下 输出 : 


这 是 for 语句 的 最 简单 用 法 ， 后 面 我 们 会 看 到 更 多 的 用 法 。 但 这 
样 已 经 足够 重 写 刚才 的 画 正方 形 的 程序 了 。 请 重 写 后 再 接着 阅读 。 


下 面 是 使 用 for 语句 绘制 正方 形 的 程序 : 


for i in range(4): 
bob.fd(100) 


bob.1t(90) 


for 语句 的 语法 和 函数 定义 类 似 。 它 也 有 一 个 以 冒号 结束 的 语句 
头 ， 并 有 一 个 缩 进 的 语句 体 。 语 句 体 可 以 包含 任意 数量 的 语句 。 


for 语句 也 称 为 循环 (loop) ， 因 为 执行 流程 会 志 历 语句 体 ， 之 
0 执行 。 在 这 个 例子 里 ， 语 句 体 执行 了 4 


学 可 


这 个 版 本 的 代码 和 之 前 的 绘制 正方 形 的 代码 其 实 还 稍 有 不 同 ， 
为 在 最 后 一 次 循环 后 它 多 做 了 一 次 左 转 。 多 余 的 左 转 稍 微 多 消耗 了 所 
时 间 ， 但 因为 每 次 循环 做 的 事情 都 一 样 ， 也 让 代码 更 简练 。 这 个 版 本 
的 代码 还 有 一 个 效果 ， 程 序 执行 完 之 后 ， 乌 龟 会 回归 到 初始 的 位 置 ， 
并 天 加 初始 相同 的 方 网 。 


4.3 ”练习 


下 面 是 一 系列 使 用 马 怨 世界 的 练习 。 它 们 力求 有 趣 ， 但 也 包含 着 
某 些 离 意 。 做 这 些 练习 时 ， 可 以 猜想 一 下 其 离 意 。 


在 接 下 来 的 章节 中 有 这 些 练习 的 解答 ， 所 以 在 完成 〈 或 着 至 少 党 
试 过 ) 之 前 ， 请 先 别 继续 阅读 。 


1， 写 一 个 函数 square ， 接 受 一 个 形 参 t ， 用 来 表示 一 只 乌 怨 。 
利用 乌龟 来 画 一 个 正方 形 。 


写 一 个 函数 调用 传 入 pob 作为 实 参 来 调用 square 函数 ， 并 再 运 
一 遍 程序 。 


2. 给 square 函数 再 添加 一 个 形 参 1ength 。 修 改 函 数 内 容 ， 保 
证 正方 形 的 长 度 是 length ， 并 修改 函数 调用 以 提供 这 第 二 个 实 参 。 再 
运行 一 遍 程序 。 使 用 不 同 的 1ength 值 测试 你 的 程序 。 


3. 复制 square 函数 ， 并 命名 为 polygon 。 再 添加 一 个 形 参 n 并 
修改 函数 体 以 绘制 一 个 正 n 边 形 。 提 示 : 正 n 边 形 的 抛 角 是 360/n 度 。 


4， 写 一 个 范 数 circle 接受 代表 马 包 的 形 参 t ， 以 及 表示 半径 的 
形 参 r ， 并 使 用 合适 的 长 度 和 边 数 调用 polygon 画 一 个 近似 的 圆 。 使 
用 不 同 的 r 值 来 测试 你 的 函数 。 


提示 : 思考 圆 的 周 长 (circumference) ， 并 保证 length * n= 


circumference 。 


另 一 个 提示 : 如 果 你 觉得 bob 太 慢 ， 可 以 修改 bob .delay 来 加 
速 。bob. delay 代表 每 次 行动 之 间 的 停顿 ， 单 位 是 秒 。bob .delay 
= 0 .01 应 该 能 让 它 跑 得 足够 快 。 


5. 给 circle 玉 数 写 一 个 更 通用 的 版 本 ， 称 为 arc 。 增 加 一 个 形 
参 angle ， 用 来 表示 画 的 圆 缴 的 大 小 。 这 里 angle 的 单位 是 度数 ， 所 
以 当 arc=360 时 ， 则 会 画 一 个 整 圆 。 


4.4 封装 


第 一 个 练习 要 求 把 画 正方 形 的 代码 放 到 一 个 画 数 定义 中 ， 并 将 乌 
包 bob 作为 实 参 传 入 ， 调 用 该 丽 数 。 下 面 是 一 个 解答 : 


def square(t): 
for i in range(4): 
t.fd(100) 
t.1t(90) 


square(bob) 


最 内 侧 的 语句 ，fd 和 1t 都 缩 进 了 两 层 ， 表 示 它 们 是 在 for 语句 
的 语句 体内 部 ， 而 for 语句 在 函数 定义 的 函数 体内 部 。 最 后 一 行 ， 
square(bob) ， 又 重新 从 无 侧 开 始 而 没有 缩 进 ， 这 表明 for 语句 和 
square 函数 的 定义 都 已 经 结 


在 函数 体 中 ，t 引用 的 乌龟 和 bob 引用 的 相同 ， 所 以 t .1t (909) 
和 直接 调用 bob ,1Lt(90) 是 一 样 的 效果 。 在 这 种 情况 下 为 什么 不 直接 
把 形 参 写 为 bob 呢 ? 原因 是 t 可 以 是 任何 乌龟 ， 而 不 仅仅 是 bob ， 所 
以 可 以 再 新 建 一 只 马 龟 ， 并 将 它 作为 参数 传 入 到 square 函数 : 


alice = Turtle() 
square(alice) 


把 一 段 代码 用 函数 包 于 起 来 ， 称 为 封装 (encapsulation) 。 封 装 的 
一 个 好 处 是 ， 它 给 这 段 代 码 一 个 有 意义 的 名 称 ， 增 加 了 可 读 性 。 另 一 
个 好 处 是 ， 当 重复 使 用 这 上段 代码 时 ， 调 用 一 次 函数 比 复制 粘贴 代码 要 
人 简易 得 多 ! 


4.5 泛 化 


下 一 步 是 给 square 函数 添加 一 个 length 参数 。 这 里 是 一 个 解决 


def square(t, length): 
for i in range(4): 
t.fd(length) 
t.1t(90) 


square(bob, 100) 


给 函数 添加 参数 的 过 程 称 为 汉化 (generalization) ， 因 为 它 会 让 
函数 变 得 更 通用 : 在 之 前 的 版 本 中 ， 正 方形 总 是 一 个 大 小 ， 而 新 的 版 
本 中 ， 可 以 是 任意 大 小 * 


下 一 步 也 是 一 次 泛 化 。 我 们 不 再 只 绘制 正方 形 ， 而 是 可 以 绘制 任 
意 边 数 的 多 边 形 。 这 里 是 一 个 方案 : 


def polygon(t, n, length): 
angle = 360 / n 
for i in range(n): 
t.fd(length) 
t.lt(angle) 


polygon(bob, 7, 70) 


这 个 例子 绘制 一 个 7 边 形 ， 边 长 是 70。 


如 果 使 用 的 是 Python 2， 那 么 angle 的 值 可 能 会 因为 整数 除法 而 错 
误 。 一 个 简单 的 解决 办 法 是 使 用 angle = 360.0 / n。 因 为 分 子 是 
一 个 浮 点 数 ， 所 以 结果 也 会 是 浮 点 数 。 


如 末了 国 数 的 形 参 比较 多 ， 很 容易 起 挥 每 一 个 具体 十 什么 ， 或 者 起 
掉 它 们 的 顺序 。 所 以 在 Python 中 ， 调 用 函数 时 可 以 加 上 形 参 名 称 ， 这 样 
征 合 法 的 ， 并 且 有 时 候 会 有 玫 助 : 


polygon(bob, n=7, length=70) 


这 些 参数 被 称 为 关键 词 参数 (keyword argument) ， 因 为 它们 使 
用 “关键 词 * 的 形式 带 上 了 形 参 的 名 称 调用 (请 别 和 while 与 def 之 类 
的 Python 关键 字 混 消 ) 。 


这 个 语法 使 得 程序 更 加 可 读 。 它 也 同样 提示 了 我 们 实 参 和 形 参 的 
工作 方式 ， 当 调用 画 数 时 ， 实 参 传 入 并 赋值 给 形 参 。 


4.6 接口 设计 


下 一 步 是 写 男 圆 的 circle 芳 数 ， 接 受 形 参 r ， 表 示 圆 的 半径 。 下 
面 是 一 个 简单 的 例子 ， 通 过 调用 polygon 函数 画 50 边 的 多 边 形 : 


Import math 


def circle(t, r): 


circumference = 2 * math.pi * 上 
n= 50 

length = circumference / n 
polygon(t, n, length) 


第 一 行 计算 半径 为 r 的 圆 的 周 长 ， 使 用 公式 2rr 。 因 为 我 们 使 用 的 
是 math ,pi ， 所 以 需要 先导 入 math 模块 。 依 照 惯例 ，import 语句 
一 般 都 放 在 脚本 开头 。 


n 是 我 们 用 于 近似 画 圆 的 多 边 形 的 边 数 ， 所 以 length 是 每 个 边 的 
长 度 。 因 此 ，polygon 画 出 一 个 50 边 形 ， 近 似 于 一 个 半径 为 r 的 圆 。 


这 个 解决 方案 的 缺点 之 一 是 n 是 一 个 音量 ， 因 此 对 于 很 大 的 圆 ， 多 
边 形 的 边线 太 长 ， 而 对 于 小 圆 ， 我 们 又 急 费 时 间 去 画 过 短 的 边线 。 解 
决 办 法 之 一 是 泛 化 这 个 函数 ， 加 上 形 参 n。 这 样 可 以 给 用 户 (调用 
circle 芳 数 的 人 ) 更 多 的 控制 选择 ， 但 接口 吏 不 那么 清晰 整 放 了 。 


函数 的 接口 是 如 何 使 用 它 的 概要 说 明 : 它 有 哪些 参数 ? 这 个 函数 
做 什么 ? 它 的 返回 值 是 什么 ? 我 们 说 一 个 接口 “整洁 ”(clean) ， 是 说 


已 能 够 让 调用 者 完成 所 想 的 事情 ， 而 不 需要 处 理 多 余 的 细 广 。 


在 这 个 例子 里 ,r 属于 函数 的 接口 ， 因 为 它 指定 了 所 画 的 圆 的 基本 
属性 。 相 对 地 ，n 则 不 那么 适合 ， 因 为 它 说 明 的 是 如 何 画 圆 的 细节 信 


ollly 
a 


所 以 与 其 弄 乱 接口 ， 不 如 在 代码 内 部 根据 周 长 来 选择 合适 的 n 值 : 


def circle(t, r): 
circumference = 2 * math.pi * r 
n = int(circumference / 3) + 1 


length = circumference / n 
polygon(t, n, length) 


现在 多 边 形 的 边 数 是 一 个 接近 circumference/3 的 整数 ， 所 以 
每 个 边 长 近似 是 3， 已 经 小 到 足够 画 出 好 看 的 圆 形 ， 但 又 足够 大 到 不 影 
啊 画 线 效 率 ， 并 且 可 接受 任何 尺寸 的 圆 。 


4.7 重 构 


当 我 写 circle 函数 时 ， 我 可 以 复 用 polygon ， 因 为 边 数 很 多 的 
正 多 边 形 是 圆 的 很 好 的 近似 。 但 是 arc 则 并 不 那么 容易 对 付 ; 我 们 不 
能 使 用 polygon 或 者 circle 来 画 圆 弧 。 


换个 办 法 ， 可 以 先 复 制 一 个 polygon 函数 ， 再 通过 修改 得 到 arc 
函数 。 结 朱 可 能 类 似 下 面 的 示例 : 


def arc(t, r, angle): 
arc_lJength = 2 * math.pi * r * angle / 360 
n = int(arc_ length / 3) + 1 
step_length = arc_length / n 


step_angle = angle / n 


for i in range(n): 
t.fd(step_length) 
t.lt(step_angle) 


这 个 函数 的 第 二 部 分 很 像 polygon 的 实现 ， 但 如 果 不 修改 
polygon 的 接口 ， 无 法 直接 复 用 。 我 们 也 可 以 泛 化 polygon 函数 以 
接受 第 三 个 参数 表示 圆 弧 的 角度 ， 但 那样 的 话 polygon (多 边 形 ) 就 
不 是 合适 的 名 称 了 ! 所 以 ,我 们 将 这 个 更 泛 化 的 画 数 称 为 polyline 


是 合 
(多 边线 ) ， 


def polyline(t, n, length, angle): 
for i in range(n): 
t.fd(length) 


t.lt(angle) 


现在 我 们 可 以 重 写 polygon 和 arc ， 计 它们 调用 polyline : 


def polygon(t, n, length): 
angle = 360.0 /nN 
polyline(t, n, length, angle) 


def arc(t, r, angle): 
arc_length = 2 * math.pi * r * angle / 360 


n = int(arc_length / 3) + 1 
step_length = arc_length / n 

step_angle = float(angle) / n 
polyline(t, n, step_length, step_angle) 


最 后 ， 我 们 可 以 重 写 circle ， 改 为 调用 arc : 


def circle(t, r): 
arc(t, r, 360) 


这 个 过 程 一 一 重新 组 织 程序 ， 以 改善 接口 ， 提 高 代码 复 用 一 被 
称 为 重 构 (refactoring) 。 在 这 个 例子 里 ， 我 们 注意 到 arc 和 
polygon 中 有 类 似 的 代码 ， 因 此 我 们 把 它们 的 共同 之 处 “ 重 构 出 来 * 抽 
取 到 polyline 函数 中 。 


如 琳 我 们 早早 计划 ， 可 能 会 直接 先 写 Mpolyline ， 也 束 避 人 免 了 
重 构 ， 但 实际 上 在 工程 开始 时 我 们 往往 并 没有 足够 的 信息 去 完美 设计 
所 有 的 接口 。 开 始 编码 之 后 ， 你 会 更 了 解 面 对 的 问题 。 有 时 候 ， 重 构 

意味 着 你 在 编程 中 掌握 了 一 些 新 的 东西 。 


4.8 ”一 个 开发 计划 


开发 计划 (development plan) 是 写 程序 的 过 程 。 本 章 的 案例 分 析 
中 ， 我 们 使 用 的 过 程 是 “封装 和 泛 化 >。 这 个 过 程 的 具体 步骤 是 : 


1， 最 开始 写 一 些小 程序 ， 而 不 需要 函数 定义 。 


2. 一旦 程序 成 功 运 行 ， 识 别 出 其 中 一 段 完整 的 部 分 ， 将 它 封 装 到 
一 个 函数 中 ， 并 加 以 命名 。 


3， 泛 化 这 个 画 数 ， 添 加 合适 的 形 参 。 


4. 重复 步 又 1 到 步骤 3， 直 到 得 到 一 组 可 行 的 函数 。 复 制 烙 贴 代 
码 ， 以 避免 重复 输入 (以 及 重复 调试 ) 。 


5. 寻找 可 以 使 用 重 构 来 改善 程序 的 机 会 。 例 如 ， 如 果 发 现 程序 中 
几 处 地 方 有 相似 的 代码 ， 可 以 考虑 将 它们 抽取 出 来 做 一 个 合适 的 通用 
画 数 。 


这 个 过 程 也 有 一 些 缺 点 一 一 我 们 会 在 后 面 看 到 其 他 方式 一 一 但 如 
果 在 开始 编程 时 不 清楚 如 何 将 程序 分 成 适合 的 函数 ， 这 样 做 会 带 来 帮 
助 。 这 个 方法 能 让 你 一 边 开 发 一 边 设计 。 


4.9 ”文档 字符 串 


文档 字符 串 (docstring) 是 在 函数 开头 用 来 解释 其 接口 的 字符 串 
(doc 是 “文档 ”documentation 的 缩写 ) 。 下 面 是 一 个 示例 ; 


def polyline(t, n, length, angle): 
"""Draws n line segments with the given length and 
angle (in degrees) between them. t is a turtile. 


for i in range(n): 
t.fd(length) 
t.1lt(angle) 


依照 惯例 ， 所 有 的 文档 字符 串 都 使 用 三 引号 括 起 来 。 二 
串 又 称 为 多 行 字符 串 ， 因 为 三 引号 允许 字符 串 跨 行 表 示 。 


2 
< 了 
小 
计 


文档 字符 串 很 简 活 ， 但 已 经 包含 了 其 他 人 需要 知道 的 关于 函数 的 
基本 信息 。 它 简明 地 解释 了 函数 是 做 什么 的 〈 而 不 涉及 如 何 实现 的 细 
方 ) 。 它 解释 了 每 个 形 参 对 函数 行为 的 影响 效果 以 及 每 个 形 参 应 有 的 
类 型 (如果 其 类 型 并 不 显而易见 ) 


编写 这 类 文档 是 接口 设计 的 重要 部 分 。 一 个 设计 民 好 的 接口 ， 也 
应 当 很 傈 单 开 能 解释 清楚 ， 如 果 你 发 现 解释 一 个 函数 很 困难 ， 很 可 能 
表示 该 接口 有 改进 的 空间 。 


4.10 调试 


函数 的 接口 ， 作 用 束 像 是 男 数 和 调用 者 之 间 釜 订 的 一 个 。 调 
用 者 同意 提供 某 些 参数 ， 而 函数 则 同意 使 用 这 些 参数 做 某 种 工作 。 


例如 ，polyline 需要 4 个 参数 : t 必须 是 一 个 Turtle; n 必须 是 整 
数 ，length 应 当 是 个 正 数 ， 而 angle 则 必须 是 一 个 数字 ， 并 且 按 照 
度数 来 理解 。 


这 些 需求 被 称 为 前 置 条 件 ， 因 为 它们 应 当 在 函数 开始 执行 之 前 就 
保证 为 真 。 相 对 地 ， 画 数 结束 的 时 候 需 要 满足 的 条 件 称 为 后 置 条 件 。 
后 置 条 件 包含 了 函数 预期 的 效果 〈 如 画 出 线段 ) 以 及 任何 副作用 (如 
移动 马 鱼 或 者 引起 其 他 改变 ) 。 


满足 前 置 条 件 是 调用 者 的 职责 。 如 采 调 用 者 违反 了 一 个 (文档 说 
明 清 晰 的 ! ) 前 置 条 件 ， 因 而 导致 画 数 没有 正确 运行 ， 则 bug 是 在 调用 
者 ， 而 不 在 函数 本 号。 


如 琳 前 置 条 件 已 经 满足 ， 但 后 置 条 件 没有 满足 ， 那 么 bug 整 出 现在 
函数 本 身 。 如 采 前 置 和 后 置 前 置 都 定义 清晰 ， 可 以 帮助 调试 。 


4.11 术语 表 


方法 (method) : 与 某 个 对 象 相关 联 的 一 个 函数 ， 使 用 句点 表达 
却 调 用 。 


循环 (loop) : 程序 中 的 一 个 片段 ， 可 以 重复 运行 


封装 (encapsulation) : 将 一 组 语句 转换 为 范 数 定义 的 过 程 。 


泛 化 〈generalization) : 将 一 些 不 必要 的 具体 值 (如 一 个 数字 ) 
替换 为 合适 的 通用 参数 或 变量 的 过 程 。 


关键 词 参数 (keyword argument) : 调用 函数 时 ， 附 带 了 参数 名 称 
(作为 一 个 “关键 词 "来 使 用 ) 的 参数 。 


接口 ”(interface) : 描述 函数 如 何 使 用 的 说 明 。 包 括 函 数 的 名 称 ， 
以 及 形 参与 返回 值 的 说 明 。 


重 构 (refactoring) : 修改 代码 并 改善 画 数 的 接口 以 及 代码 质量 的 
过 程 。 


开发 计划 (development plan) : 写 程 序 的 过 程 。 


文档 字符 串 (docstring) : 在 函数 定义 开始 处 出 现 的 用 于 说 明 画 
数 接口 的 字符 串 。 


前 置 条 件 (precondition) : 在 函数 调用 开始 前 应 当 满 足 的 条 件 。 
后 置 条 件 (postcondition) : 在 函数 调用 结束 后 应 当 满 足 的 条 件 。 


4.12 ”练习 


练习 4-1 
在 http:/thinkpython2.comy/code/polygon.py 下 载 本 章 的 代码 。 


1.， 画 一 个 栈 图 来 显示 函数 circle(bob，radius) 运行 时 的 程 
序 状态 。 你 可 以 手动 计算 ， 或 者 在 代码 中 添加 一 些 print 语句 。 


2， 在 4.7 廊 中 的 arc 函数 并 不 准确 ， 因 为 使 用 多 边 形 模拟 近似 圆 ， 
总 是 会 在 真实 的 圆 之 外 。 因 此 ，Turtle 画 完 线 之 后 会 停 在 偏离 正确 的 目 
标 几 个 像素 的 地 方 。 我 的 解决 方案 里 展示 了 一 种 方法 可 以 减少 这 种 错 
误 的 效果 。 阅 读 代 码 并 考虑 是 否 合理 。 如 有 果 你 自己 画图 ， 可 能 会 发 现 
它 是 如 何 生 效 的 。 


练习 4-2 
写 一 组 合适 的 通用 函数 ， 用 来 画 出 图 4-1 所 示 的 花 朱 图 案 。 


解答 http://thinkpython2.com/code/flower.py， 男 外 也 需要 
http://thinkpython2.com/code/ polygon.py ° 


图 4-1 论 打 图 案 


练习 4-3 
写 一 组 合适 的 通用 函数 ， 用 来 画 出 图 4-2 所 示 的 图 形 。 


解答 : http:/thinkpython2.comy/code/pie.py。 


图 4-2 ”人 饼 图 


7 认 4-4 


字母 表 中 的 字母 可 以 使 用 一 些 基本 元 素来 构成 ， 如 横 线 、 竖 线 以 
及 一 些 曲 线 。 设 计 一 个 字母 表 ， 可 以 使 用 最 少 的 基本 元 素 画 出 来 ， 并 
编写 画 数 来 画 出 字母 。 


你 应 当 给 每 个 字母 单独 写 一 个 钞 数 ， 名 称 为 draw_a 、draw_b 

， 并 把 这 些 函 数 放 到 letters .py 文件 中 。 可 以 从 
http://thinkpython2.com/code/typewriter.py 下 载 一 个 “ 马 龟 打 字 机 ”程序 来 
帮助 测试 你 的 代码 。 


你 可 以 在 http:/Wthinkpython2.comy/code/letters.py 获 得 解答 ， 另 外 也 需 
要 http://thinkpython2.com/ code/polygon.py。 


练习 4-5 


在 http://en.wikipedia.org/wiki/Spiral 阅 读 关 于 螺旋 线 (spiral) 的 信 
息 ; 接着 编写 一 段 程序 来 画 出 阿 基 米 德 螺旋 (或 者 其 他 的 某 种 螺旋 
线 ) 。 


解答 : http://thinkpython2.comy/code/spiral.py。 


第 5 章 ”条 件 和 递归 


本 章 的 主要 话题 是 if 表达 式 ， 它 根据 程序 的 状态 执行 不 同 的 代 
码 。 但 首先 我 想 要 介绍 两 个 新 操作 符 ， 疝 下 取 整 除法 操作 符 和 求 模 操 


5.1 回 下 取 整 除法 操作 符 和 求 模 操作 符 


向 下 取 整 除法 操作 符 (// ) 对 两 个 数 进行 除法 运算 ， 并 向 下 取 整 
得 到 一 个 整数 。 例 如 ， 假 设 一 个 电影 的 播放 时 长 为 105 分 钟 ， 你 可 能 会 
想 知 道 按 小 时 算 这 是 多 长 。 传 统 的 除法 会 得 到 一 个 浮 点 数 : 
>>> minutes = 105 


>>> minutes / 60 
1.75 


但 是 ， 我 们 在 写 小 时 数 时 通 芝 并 不 用 小 数 挟 。 同 下 取 整 除法 ， 则 
丢弃 小 数 部 分 ， 得 到 整数 的 小 时 数 : 


>>> minutes = 105 
>>> hours = minutes // 60 
>>> hours 


1 


要 求 得 余数 ， 可 以 从 分 钟 数 中 减 去 1 小 时 : 


>>> remainder = minutes - hours * 60 
>>> remainder 


| 
男 一 种 办 法 是 使 用 求 模 操 作答 (% ) 将 两 个 数 相 除 ， 得 到 余数 : 


>>> remainder = minutes % 60 
>>> remainder 
45 


求 模 操作 符 其 实 有 很 多 实际 用 途 。 例 如 ， 可 以 用 它 来 检测 一 个 数 
是 不 是 男 一 个 的 倍数 一 一 如 果 x % y 是 0， 则 x 可 以 被 y 整除 。 


男 外 ， 也 可 以 用 它 来 获取 一 个 数 后 一 位 或 后 几 位 数 子 。 例 如 ，x % 
19 可 以 得 到 x 的 个 位 数 〈10 进 制 ) 。 类 似 地 ，x % 109 可 以 获得 最 后 
两 位 数 。 


如 琳 使 用 的 是 Python 2， 除 法 机 制 会 有 所 不 同 。 除 法 操作 符 WV) 在 
两 个 操作 数 都 是 整数 的 情况 下 ， 实 际 进行 的 是 同 下 取 人 整除 法 操作 ， 而 
当 两 个 操作 数 中 有 一 个 是 浮 点 数 时 ， 则 进行 的 是 浮 点 数 除法 。 


5.2 布尔 表达 式 


布尔 表达 式 是 值 为 真 或 假 的 表达 式 。 下 面 的 例子 中 使 用 了 == 操作 


符 ， 来 比较 两 个 操作 对 象 是 否 相 等 。 如 有 果 相 等 ， 则 得 True ， 人 否则 是 


False : 


True 和 False 是 类 型 bool 的 两 个 特殊 值 ; 它们 不 是 字符 串 : 


>>> type(True) 
<class 'bool'> 
>>> type(False) 


<class 'bool'> 


== 操作 符 是 一 个 关系 操作 符 ， 其 他 的 关系 操作 符 有 : 


虽然 你 可 能 对 这 些 操作 已 经 熟悉 ， 但 是 Python 的 符号 和 数学 符号 还 
征 有 些 区 别 的 。 最 常见 的 错误 是 使 用 单 等 号 (= ) 而 不 是 双 等 号 (== 
) 。 请 记 住 = 是 一 个 赋值 操作 符 ， 而 == 是 一 个 关系 操作 符 。 男 外 ， 不 
存在 =< 或 者 => 这 样 的 操作 符 。 


5.3 ”逻辑 操作 符 


逻辑 操作 符 有 3 个 : and 、or 和 not 。 这 些 操作 符 的 语义 ( 意 
义 ) 和 它们 在 英语 中 的 意思 差不多 。 例 如 , x > 0 and x < 10 只 有 
当 x 比 0 大 且 比 10 小 时 才 为 真 。 


n%2 == 0 or n%3 ==0 ， 当 其 中 任意 一 个 条 件 为 真 时 为 真 ， 
也 就 是 说 ， 数 n 可 以 被 2 或 3 整除 都 可 以 。 


最 后 ，not 操作 符 可 以 否定 一 个 布尔 表达 式 ， 所 以 not (x > y) 
在 x > y 为 假 时 为 真 ， 即 当 x 小 于 等 于 y 时 真 。 


严格 地 说 ， 逻 辑 操作 符 的 操作 对 象 应 该 都 是 布尔 表达 式 ， 但 是 
Python 并 不 那么 严格 。 任 何 非 0 的 数 者 被 解释 为 True 。 


>>> 42 and True 
True 


这 种 灵活 性 可 能 会 很 有 用 ， 但 有 时 候 也 会 带 来 一 些小 困惑 。 你 可 
能 应 该 避免 使 用 它 (除非 你 很 确切 地 知道 自己 在 做 什么 。 


5.4 条 件 执行 


为 了 编写 有 用 的 程序 ， 我 们 几乎 总 是 需要 检查 条 件 并 据 此 改变 程 
序 的 行为 的 能 力 。 条 件 语 句 给 了 我 们 这 种 能 力 。 最 简单 的 形式 是 if 表 
到 起 | 


if x > 0: 
print('x is positive') 


if 之 后 的 布尔 表达 式 被 称 为 条 件 (condition) 。 如 果 它 为 真 ， 则 
之 后 缩 进 的 语句 会 运行 。 否 则 ， 什 么 都 不 发 生 。 


if 表达 式 的 结构 和 函数 定义 一 样 :一 个 语句 涉 ， 接 着 是 缩 进 的 语 
句 体 。 这 种 类 型 的 语句 称 为 复合 语句 。 


语句 体 中 出 现 的 语句 数量 并 没有 限制 ， 但 是 最 少 需要 一 行 。 偶尔 
可 能 会 遇 到 需要 一 个 语句 体 什么 都 不 做 (通常 是 标记 一 个 你 还 没有 来 
得 及 写 的 代码 的 位 置 ) 。 这 个 时 候 ， 可 以 使 用 pass 语句 。pass 语句 
什么 都 不 做 。 


# TODO: 需要 处 理 负 值 的 情况 ! 


5.5 ”选择 执行 


if 语句 的 第 二 种 形式 是 选择 执行 ， 这 种 形式 下 ， 有 两 种 可 能 ， 而 
if 的 条 件 决定 哪 一 种 运行 。 语 法 看 起 来 是 这 样 的 : 


If x%2 == 0: 
print('x Is even') 
lse: 


print('x is odd') 


如 果 x 除 以 2 的 余数 是 0， 则 我 们 知道 x 是 偶数 (even) ， 并 且 程 序 
会 显示 合适 的 消 轧 even ' 。 如 于 条 件 为 假 ， 则 第 二 段 语句 会 运行 。 
为 条 件 必 定 是 真 假 之 一 ， 所 以 必然 只 会 有 一 段 语句 运行 。 这 两 段 不 同 
的 语句 称 为 分 支 (branch) ， 因 为 它们 是 程序 执行 流程 中 的 两 个 文 


5.6 ”条件 链 


有 时 候 有 超过 两 种 的 可 能 ， 所 以 我 们 需要 更 多 的 分 文 。 表 达 这 种 
计算 的 一 种 方式 是 条 件 链 〈chained conditional) : 


if x < y: 
print('x is less than y') 
elif x > y: 


print('x is greater than y') 
else: 
print('x and y are equal') 


elif 是 “else if ”的 缩写 。 和 之 前 一 样 ， 只 有 一 个 分 文 会 运行 。 
elif 语句 的 数量 没有 限制 。 如 采 有 一 个 else 语句 ， 则 它 必须 放 在 最 
后 。 但 也 可 以 没有 else 语句 。 
if choice == 'a': 

draw_a() 


elif choice == 'b': 
draw_b() 


elif choice == 'c': 
draw_c() 


每 个 条 件 都 按 顺序 检查 。 如 果 第 一 个 是 false， 则 检查 下 一 个 ， 依 
此 类 推 。 如 果 有 一 个 条 件 为 真 ， 则 运行 相应 的 分 支 ， 而 整个 语句 结 
束 。 即 使 有 多 个 条 件 为 真 ， 也 只 有 第 一 个 为 真 的 分 支 会 运行 


5.7“” 骸 套 条 件 


条 件 判 断 可 以 再 和 藤 委 条 件 判 晰 。 我 们 可 以 修改 前 一 节 中 的 示例 ， 
则 下 


if x == y: 

print('x and y are equal') 
else: 

if x<y 


print('x is less than y') 
else: 
print('x is greater than y') 


外 侧 的 条 件 语 名 包含 两 个 分 文 。 第 一 个 分 文 包含 一 行 简单 的 语 
句 。 第 二 个 分 支 则 包含 了 男 一 个 if 语句 ， 它 本 身 也 有 两 个 分 文 。 这 两 
个 分 文 也 都 旦 简单 语 铝 ， 虽 然 它 们 其 实 也 可 以 是 条 件 语句 。 


虽然 语句 的 缩 进 让 结构 非常 明晰 ， 但 航 套 条 件 语 句 会 很 快 随 着 髓 
套 层 数 增多 而 变 得 非常 难以 阅读 。 应 该 尽量 避免 它 。 


逻 神 操作 符 和 音 能 够 用 来 商 化 能 套 条 件 语 柯 。 例 如 ， 我 们 可 以 将 
下 面 的 语句 车 换 为 单独 的 一 个 条 件 : 


ijf © < x: 
if x < 10: 


print('x is a positive Single-digit number.') 


print 语句 只 有 在 两 个 条 件 语 名 都 通过 时 才 运 行 ， 所 以 我 们 可 以 
使 用 and 操作 符 达 到 相同 的 效果 : 


if 0 < x and x < 10: 
print('x is a positive single-digit number.') 


对 于 这 种 类 型 的 条 件 ，Python 还 提供 了 一 个 更 简洁 的 语法 : 


if 0O< x < 10: 
print('x is a positive single-digit number.') 


5.8 ”递归 


函数 调用 另外 一 个 函数 是 合法 的 ; 函数 调用 目 己 也 坪 合 法 的 。 这 
样 做 有 什么 好 处 可 能 还 不 明显 ， 但 它 其 实 是 程序 能 做 的 最 神奇 的 事情 


一 。 例 如， 考虑 下 面 的 函数 : 


def countdown(n): 
if n <= 0: 
print('Blastoff!') 
lse: 


print(n) 
countdown(n - 1) 


如 果 n 是 0 或 负数 ， 它 会 输出 单词 “Blastoff!*"， 其 他 情况 下 ， 它 会 输 
出 n ， 并 调用 一 个 名 为 countdown 的 函数 一 它 自己 一 并 传 入 实 参 
Nn-1° 


我 们 调用 这 个 函数 时 会 发 生 什么 ? 


>>> countdown(3) 


countdown 的 执行 从 n=3 开始 ， 因 为 n 比 0 大 ， 所 以 会 输出 3， 并 
接着 调用 自己 ...... 


countdown 的 执行 从 n=2 开始 ， 因 为 n 比 0 大 ， 所 以 会 输出 
2， 并 接着 调用 目 己 .……. 


countdown 的 执行 从 n=1 开始 ， 因 为 n 比 0 大 ， 所 以 会 输 
出 1， 并 接着 调用 上 自己 .……. 


countdown 的 执行 从 n=0 开始 ， 因 为 n 不 比 0 大 ， 所 以 
会 输出 单词 “Blastoff!”， 并 返回 。 


接收 n=1 的 函数 countdown 返回 。 


接收 n=2 的 函数 countdown 返回 。 
接收 n=3 的 函数 countdown 返回 。 
然后 就 会 到 了 __main__ 函数 。 所 以 ， 全 部 的 输出 如 下 : 


3 
2 
1 
Blastoff! 


调用 自己 的 函数 称 为 递归 的 (recursive) 函数 ， 这 个 执行 的 过 程 
叫 作 递 归 (recursion) 。 


男 外 举 一 个 例子 ， 我 们 可 以 写 一 个 函数 打印 某 个 字符 串 n 次 。 


def print_n(s, n): 
ifn <= 0: 
return 


print(s) 
print_n(s, n-1) 


如 果 n <= 0 ，return 语句 会 直接 退出 当前 琅 数 。 执 行 流程 会 
即 返 回 到 调用 者 ， 之 后 的 语句 不 会 运行 。 


函数 另外 的 部 分 和 countdown 类 似 : 如 果 n 大 于 0， 它 会 打印 s 并 
且 调 用 自己 ， 以 再 进行 hn -1 次 显示 s 的 操作 。 所 以 输出 的 行 数 是 1+ 
(n-1) ， 也 就 是 n 。 


对 于 这 样 简单 的 例子 来 说 ， 可 能 使 用 for 循环 会 更 容易 。 但 我 们 
会 在 后 面 见 到 一 些 示例 ， 使 用 for 循环 很 难 写 ， 但 使 用 递归 则 会 很 简 


单 ， 所 以 早早 开始 了 解 递归 是 件 好 事 。 


5.9 ”递归 函数 的 栈 图 


在 3.10 节 中 ， 我 们 使 用 一 个 栈 图 来 表示 程序 在 进行 画 数 调 用 时 的 状 
态 。 同 样 的 栈 图 ， 可 以 用 来 帮助 我 们 解释 递归 函数 。 


一 个 函数 每 次 被 调用 时 ，Python 会 创建 一 个 帧 (function frame) ， 
来 包含 画 数 的 局 部 变量 和 参数 。 对 于 递归 画 数 ， 栈 上 可 能 同时 存在 多 
个 函数 帧 。 


图 5-1 展 示 了 countdown 函数 在 n=3 调用 时 的 栈 图 。 
ren 
countdown n —> 3 
countdown n —> 2 
countdown Nn —>1 


countdown n 一 > 0 


图 5-1 栈 图 


和 往常 一 样 ， 栈 的 顶端 是 _main__ 的 函数 帧 。 因 为 我 们 没有 在 
main__ 函数 里 新 建 任何 变量 或 传 入 任何 参数 ， 所 以 它 是 空 的 。 


4 个 countdown 函数 帧 有 不 同 的 参数 n 值 。 昌国 出 的 栈 ， 其 n=0 
， 被 称 为 基准 情形 (base case) 。 因 为 它 不 再 进行 递归 调用 ， 所 以 后 
面 没 有 其 他 函数 帧 了 。 


作为 练习 ， 为 函数 print_n 画 一 个 栈 图 ， 其 调用 实 参 是 S = 
'Hello' 和 n=2 。 然 后 写 一 个 函数 do_n ， pi 
数字 n 作为 形 参 。 它 会 调用 给 定 的 函数 n 次 。 


5.10” 无限 递归 


en a 则 它 会 永远 继续 递归 调用 ， 
而 程序 也 永 不 停止 。 这 个 现象 被 称 为 无 限 递归 ， 而 它 并 不 是 个 好 主 
意 。 ee 逮 归 的 最 镜 单 钞 数 : 


def recurse(): 
recurse() 


在 大 多 数 程序 环境 中 ， 无 限 递归 的 函数 并 不 会 真 的 永远 执行 。 
Python 会 在 递归 深度 到 达 上 限时 报告 一 个 出 错 消 息 : 


File "<stdin>", line 2, in recurse 
File "<stdin>", line 2 in recurse 
File "<stdin>", line 2, in recurse 


File "<stdin>", line 2, in recurse 
RuntimeError: Maximum recursion depth exceeded 


这 个 调用 回溯 比 上 一 章 看 到 的 要 大 一 些 。 当 这 个 错误 发 生 时 ， 栈 
上 已 经 有 1000 个 recurse 帧 了 ! 


如 有 果 你 不 小 心 写 出 了 一 个 无 限 循环 ， 请 复查 目 己 的 钞 数 ， 确 认 里 
面 至 少 有 一 个 基准 情形 不 进行 递归 调用 。 如 果 已 经 有 了 一 个 基准 情 
形 ， 检 查 是 否 已 经 确保 在 运行 时 能 达到 它 。 


5.11 键盘 输入 


目前 为 止 我 们 写 过 的 程序 都 还 不 能 接收 用 户 的 输入 。 它 们 只 能 每 
次 做 相同 的 事情 。 


Python 提供 了 一 个 内 置 画 数 input 来 从 键盘 获取 输入 并 等 待 用 户 
Rs 当 用 户 按 下 回 车 键 ， 程 序 会 恢复 运行 ， 而 且 input 则 
过 子 符 串 形式 返回 用 户 输入 的 内 容 。 在 Python 2 里 ， 这 个 函数 叫 


raw_input 。 


>>> text = input() 
Whate are you waiting for? 


>>> text 
Whate are you waiting for? 


在 从 用 户 那 里 获得 输入 之 前 ， 最 好 打印 一 个 提示 信息 ， 告 诉 用 户 
希望 他 们 输入 什么 。raw_input 函数 可 以 接受 一 个 参数 作为 提示 : 
>>> name = input('What...is your name?\n') 


. .is your name? 
King of the Britons! 


King of the Britons! 


提示 信息 最 后 的 \n 表示 一 个 换行 符 ， 它 是 会 引起 输出 显示 换行 的 
特殊 字符 。 这 也 是 为 何 用 户 的 输入 显示 在 提示 信息 的 下 一 行 的 原因 。 


如 果 和 希望 用 户 输入 一 个 整数 ， 可 以 答 试 将 输入 值 转换 为 Int : 


>>> prompt = 'What...is the airspeed velocity of an unladen 
swallow?\n' 

>>> speed = input(prompt) 

What...is the airspeed velocity of an unladen swallow? 


42 
>>> int(speed) 
42 


但 如 琳 用 户 输入 不 是 数字 的 话 ， 会 得 到 错误: 


>>> speed = input(prompt) 
What...is the airspeed velocity of an unladen swallow? 
What do you mean, an African or a European swallow? 


>>> int(speed) 
ValueError: invalid literal for int() with base 10 


后 面 我 们 会 看 到 如 何 处 理 这 种 错误 。 


5.12 ”调试 


当 发 生 语 法 错误 和 运行 时 错误 时 ， 出 错 消 息 包 含 了 大 量 的 信息 ， 
但 有 了 时候 反 而 会 信息 过 量 。 最 有 用 的 信息 是 


。 错误 的 类 型 ， 
。 发 生 错 误 的 地 方 。 


语法 错误 通 前 都 很 容易 定位 ， 但 也 有 环 手 之 处 。 衬 格 问题 引起 的 
错误 很 难处 理 ， 因 为 空格 和 制 表 符 都 是 不 可 见 的 ， 我 们 已 经 习惯 于 忽 
视 它们 。 
>>> x= 5 


>>> y = 6 
File "<stdin>", line 1 


y=6 
和 人 


IndentationError: unexpected indent 


这 个 例子 中 ， 问 题 的 原因 是 第 二 行 多 缩 进 了 一 个 空格 。 但 出 错 消 
轧 指 回 的 是 y ， 容 易 误 导 。 忌 的 来 说 ， 出 错 消 居 会 告诉 我 们 发 现 错误 的 
地 址 ， 但 真正 发 生 的 地 方 可 能 在 更 前 面 的 代码 中 ， 有 时 候 甚至 在 前 一 
(a 


运行 时 销 误 也 是 如 此 。 假 设 你 想 要 按照 分 贝 来 计算 信 品 比 。 公 式 
是 SNR db 一 10 lg(P signal CP noise ) ° 在 Python 中 ， 你 可 能 会 这 么 写 : 


import math 
signal power = 9 
noise power = 10 


ratio = signal power // noise _ power 
decibels = 10 * math.1og10(ratio) 
print(decibels) 


在 运行 这 个 程序 时 ， 会 得 到 一 个 异常 : 


Traceback (most recent call last): 
File "snr.py", line 5, in ? 
decibels = 10 * math.1lo0g10(ratio) 


ValueError: math domain error 


出 错 消 恩 指 癌 第 5 行 ， 但 那 一 行 其 实 没 有 什么 错误 。 要 找到 真正 的 
错误 ， 可 能 需要 打印 出 ratio 的 值 ， 结 果 你 会 发 现 是 0。 问题 出 在 第 4 
行 ， 这 里 使 用 了 癌 下 取 整 除法 而 不 是 浮 点 数 除法 。 


你 应 该 花 一 些 时 间 认真 阅读 出 错 消息 ， 但 不 要 认为 出 错 消息 上 说 
的 每 一 样 都 对 。 


5.13 术语 表 


向 下 取 整 除法 (floor division) : 用 // 表示 的 操作 符 ， 用 于 将 两 
个 数 相 除 ， 并 对 结果 进行 回 下 取 整 《靠近 0 取 整 ) ， 得 到 整数 结 


求 模 操作 符 《modulus operator) : 用 % 表示 的 操作 符 ， 用 于 两 个 
整数 ， 返 回 两 数 相 除 的 余数 。 


布尔 表达 式 (boolean expression) : 一 种 表达 式 ， 其 值 是 True 或 


False 。 


关系 操作 符 (relational operator) : 用 来 表示 两 个 操作 对 象 的 比较 
关系 的 操作 符 ， 如 下 之 一 : ==、!=、>、<、>= 和 <=。 


逻辑 操作 符 ”(logical operator) : 用 来 组 合 两 个 布尔 表达 式 的 操作 
符 ， 有 3 个 : and 、or 和 not 。 


条 件 语句 《conditional statement) : 依照 某 些 条 件 控制 程序 执行 流 
程 的 语句 。 


条 件 (condition) ， 条 件 语句 中 的 布尔 表达 式 ， 由 它 决定 执行 哪 
一 个 分 支 。 


复合 语句 《compound statement) : 一 个 包含 语句 头 和 语句 体 的 语 
句 。 语 句 头 以 冒号 (:) 结尾 。 语 句 体 相对 语句 头 缩 进 一 层 。 


分 文 (branch) : 条 件 语句 中 的 一 个 可 能 性 分 支 语句 段 。 


条 件 链 语句 《chained conditional) : 一 种 包含 多 个 分 支 的 条 件 语 


凯 套 条 件 语 句 ”(nested conditional) : 在 其 他 条 件 语句 的 分 支 中 出 
现 的 条 件 语句 。 


返回 语句 ”(return statement) : 导致 一 个 函数 立即 结束 并 返回 到 调 
用 者 的 语句 。 


递归 ”(recursion) : 在 当前 函数 中 调用 自己 的 过 程 。 


基准 情形 (base case) : 递归 函数 中 的 一 个 条 件 分 支 ， 里 面 不 会 
再 继续 递归 调用 。 


无 限 递归 (infinite recursion) : 没有 基准 情形 的 递归 ， 或 者 永远 
无 法 达到 基准 情形 的 分 文 的 递归 调用 。 最 终 ， 这 种 无 限 递归 会 导致 运 
行 时 错误 。 


5.14 练习 


练习 5-1 


time 模块 提供 了 一 个 函数 ， 名 字 也 叫 time ， 它 能 返回 从 “ 纪 
元 ”起 到 当前 的 格林 尼 治 时 间 。“ 纪 元 ”其 实 是 人 为 选 作 基 准点 的 时 间 。 
在 UNIX 系 统 中 ， 纪 元 时 间 点 是 1970 年 1 月 1 日 。 


>>> import time 
>>> time.time() 
1437746094.5735958 


编写 一 个 脚本 ， 读 取 当 前 时 间 ， 并 转换 为 一 天 中 的 小 时 数 、 分 名 
数 、 秒 数 ， 以 及 从 纪元 起 到 现在 的 天 数 。 


练习 5-2 


费 马 大 定理 是 说 对 于 任何 大 于 2 的 n ， 不 存在 任何 正 整 数 a、b 和 c 
能 够 满足 : 


a"+b"=c" 


1. 编写 一 个 函数 check_fermat ， 接 收 4 个 形 参 (Ba ~、b 、c 
和 n ) 并 检查 费 马 定理 是 否 成 立 。 如 果 n 比 2 大 并 且 满 足 


a"+b"=c" 


则 程序 应 当 打 印 “天 哪 ， 费 马 弄 错 了 ! ”， 人 否则 程序 应 当 打 印 “不 ， 
那样 不 行 ”。 


2， 编写 一 个 函数 ， 提 示 用 户 输 入 a 、b、c 和 n 的 值 ， 将 它们 转 
换 为 整数 ， 并 使 用 check_fermat 来 检查 它们 是 否 违背 了 费 马 定 理 。 


练习 5-3 


如 琳 给 你 3 根木 棍 ， 你 可 能 可 以 将 它们 摊 成 一 个 三 角形 ， 也 可 能 不 
可 以 。 例 如 ， 如 果 一 根木 棍 的 长 度 是 12 英 寸 ， 而 其 他 两 根 都 只 有 1 英 
才 ， 那 么 你 无 法 让 短 的 木 棍 在 中 间 相 接 。 对 于 任意 3 个 长 度 ， 有 一 个 简 
单 的 测试 可 以 检验 它们 是 否 可 能 组 成 一 个 三 角形 : 


如 采 其 中 有 任意 一 个 长 度 的 值 大 于 其 他 两 个 长 度 的 和 ， 则 你 不 能 
组 成 三 角形 。 否 则 可 以 。 (如 果 两 个 长 度 的 和 等 于 第 三 个 ， 则 它们 组 
成 一 个 “退化 ”的 三 角 。) 


1. 编写 一 个 函数 js_triangle ， 接 收 3 个 整数 参数 ， 并 根据 这 组 
长 度 的 木 棍 是 否 能 组 成 三 角形 来 打印 “Yes”* 或 “No”。 


2. 编写 一 个 画 数 提示 用 户 输入 3 根木 棍 的 长 度 ， 将 其 转换 为 整 
数 ， 并 使 用 is_triangle 检查 这 些 长 度 的 木 棍 是 否 可 以 组 成 三 角形 。 


- 5-4 


下 面 的 程序 的 输出 是 什么 ? 画 一 个 栈 图 来 显示 程序 打印 结果 的 时 
候 的 状态 。 


recurse(n-1, n+s) 


recurse(3, 0) 


1. 如 果 像 recurse(-1，0) 这 样 调用 这 个 函数 ， 会 发 生 什么 ? 


2， 编写 一 段 文档 字符 串 ， 向 人 解释 清楚 要 使 用 这 个 函数 需要 知道 
的 东西 (并 且 不 多 写 其 他 内 容 ) 


3. 接 下 来 的 练习 需要 使 用 第 4 章 描述 的 turt1le 模块 。 


hoa 3]5-5 


阅读 下 面 的 函数 ， 并 看 看 你 能 否 弄 清楚 它 在 做 什么 (参看 第 4 章 中 
的 示例 ) 。 接 着 运行 它 ， 看 你 的 理解 是 否 正确 。 


def draw(t, length, 
if Nn == 0: 
return 

angle = 50 
t.fd(length*n) 
t.lt(angle) 
draw(t, length, 
t.rt(2*angle) 


draw(t, length, 
t.lt(angle) 
t.bk(length*n) 


oa :25-6 


科 赫 曲线 (Koch curve) 是 一 个 分 形 ， 它 看 起 来 像 图 5-2 所 示 。 要 
绘制 一 个 长 度 为 x 的 科 赫 曲线 ， 你 只 需要 做 : 


1. 绘制 长 度 为 x /3 的 科 赫 曲线 。 
2. 疝 左 转 60"。 

3. 绘制 长 度 为 x /3 的 科 赫 曲线 。 
4， 问 右 转 120"。 


5， 绘制 长 度 为 x /3 的 科 赫 曲线 。 
6. 问 左 转 60。。 


7. 绘制 长 度 为 x /3 的 科 赫 曲线 。 


图 5-2 ”一 个 科 赫 曲线 


当 x 比 3 小 的 时 候 例 外 : 在 那 种 情况 下 ， 你 可 以 直接 绘制 一 个 长 度 
为 x 的 直线 。 


1. 编写 一 个 函数 Koch ， 接 收 一 个 Turtle 以 及 一 个 长 度 作 为 形 参 
并 使 用 Turtle 绘 制 指定 长 度 的 科 赫 曲线 。 


.编写 一 个 函数 snowflake ， 绘 制 3 条 科 赫 曲线 ， 组 成 一 个 雪花 
形状 。 解 丛 : http://thinkpython2.com/code/koch.py ° 


3.， 科 赫 曲 线 可 以 用 几 种 方法 汉化 。 参 看 
http://en.wikipedia.org/wiki/Koch_snowflake 中 的 例子 ， 并 实现 你 最 喜欢 
的 一 个。 


第 6 章 ” 有 返回 值 的 函数 


我 们 用 过 的 很 多 Python 函数 《如 数学 函数 ) 都 会 产生 返回 值 。 但 
古 ， 到 目前 为 止 我 们 写 的 画 数 都 是 没有 返回 值 的 ， 它 们 只 产生 一 个 效 
果 ， 如 打印 某 些 值 或 者 移动 马 包 ， 但 是 并 不 返回 值 。 在 本 章 中 你 将 学 
会 如 何 写 有 返回 值 的 轴 数 。 


6.1 返回 值 


调用 函数 会 产生 一 个 返回 值 ， 我 们 一 般 会 将 它 赋值 给 一 个 变量 或 
者 用 作 表 达 式 的 组 成 部 分 : 


e = math.exp(1.0) 
height = radius * math.sin(radians) 


目前 为 止 我 们 写 的 函数 部 是 无 运 回 值 的 钞 数 。 用 通俗 的 话说 ， 它 
们 没有 返回 值 ， 用 更 精确 的 话说 ， 它 们 返回 的 值 是 None 。 


本 章 中 ， 我 们 会 (终于) 写 一 些 有 返回 值 画 数 。 第 一 个 例子 是 
area ， 用 于 计算 给 定 半 径 的 圆 的 面积 : 


def areal(radius ) : 
a = math.pi * radius**2 
return a 


之 前 我 们 已 经 见 过 return 语句 ， 但 在 有 返回 值 函 数 中 ，return 
语句 包含 了 一 个 表达 式 。 这 个 语句 的 意思 是 : “立即 从 这 个 函数 中 返 
回 ， 并 使 用 后 面 的 表达 式 作为 返回 值 。” 表 达 式 可 以 任意 复杂 ， 所 以 我 
们 可 以 把 这 个 函数 写 得 更 紧 读 : 


return math.pi * radius**2 

男 一 方面 ， 类 似 于 a 这 样 的 临时 变量 常常 会 让 调试 更 容易 。 

有 时候 函数 中 针对 不 同 的 条 件 分支 ， 各 有 各 的 返回 语句 会 很 有 用 
处 : 


def absolute_value(x): 
if x < 0: 
return -x 


else: 
return x 


因为 return 语句 分 别 在 不 同 的 分 文中 ， 只 有 一 个 运行 。 


一 旦 return 语句 运行， 当前 的 函数 就 会 终结 ， 后 面 的 语句 不 会 执 
行 。return 语句 之 后 的 代码 ， 或 者 在 其 他 程序 流程 永远 不 可 能 达到 的 
地 方 的 代码 ， 称 为 无 效 代 码 (dead code) 


在 有 返回 函数 中 ， 保 证 每 个 可 能 执行 路 径 上 都 会 遇 到 return 语 
句 ， 是 个 很 好 的 主意 。 例 如 : 


def absolute_value(x): 
if x < 0: 


return X 


这 个 函数 并 不 正确 ， 因 为 如 果 x 正好 是 0， 则 两 个 条 件 都 不 为 
true， 则 此 时 画 数 会 没有 遇 到 return 语句 就 终结 了 。 如 果 执 行 流程 到 
了 函数 的 结尾 ， 返 回 值 是 None ， 它 并 不 是 0 的 绝对 值 。 


>>> absolute_value(0) 
None 


顺便 说 一 下 ，Python 内 鞋 提供 了 计算 绝对 值 的 钞 数 abs 。 


作为 练习 ， 写 一 个 compare 落 数 ， 带 两 个 参数 x 和 y ， 如 果 x > 
y ， 返 回 1， 如 果 x == y ， 返 回 0， 如 有 果 Xx < y ， 返回 -1。 


6.2 ” 增 量 开发 


当 你 写 更 复杂 的 函数 时 ， 可 能 会 发 现 需要 更 多 的 时 间 来 调试 。 为 
了 对 应 不 断 增加 的 程序 复杂 度 ， 你 可 能 会 想 尝 斌 一 下 称 为 增 量 开发 的 
过 程 。 增 量 开发 的 目标 是 通过 每 次 只 增加 和 测试 一 小 部 分 代码 ， 来 避 
免 长 时 间 的 调试 过 程 。 


例如 ， 假 设 你 想 要 查找 两 点 之 间 的 距离 ， 给 定 坐 标 (x 1 ,y 1 ) 和 (x ;， 
y ,)。 根 据 毕 达 哥 拉 斯 定理 ， 距 离 是 : 


距离 = V Za 一 也 1 ) 十 (za 一 Yi ) 


第 一 步 考虑 Python 中 distance 函数 应 该 是 什么 样子 的 。 换 句 话 
说 ， 输 入 ( 形 参 ) 是 什么 ? 输出 (返回 值 ) 是 什么 ? 


在 这 个 例子 中 ， 输 入 是 两 个 点 ， 并 可 以 用 4 个 数字 来 表示 。 返 回 值 
年 距离 ， 它 用 一 个 浮 点 数 表 示 。 


现在 就 可 以 写 出 函数 的 轮廓 了 : 


def distance(x1, yi, x2, y2): 
return 0.0 


显然 ， 现 在 这 个 版 本 计算 的 并 不 是 距离 ， 它 总 是 返回 0。 但 它 是 语 
去 结构 正确 的 ， 并 且 能 运行 ， 即 意味 着 你 可 以 在 继续 开发 更 复杂 的 功 
能 之 前 对 它 进行 初步 的 测试 。 


要 测试 这 个 新 函数 ， 使 用 样本 参数 调用 它 : 


>>> distance(1, 2, 4, 6) 
0.0 


我 选择 这 些 值 ， 因 为 这 样 两 个 点 之 间 ， 横 癌 距 离 是 3， 纵 回 距 离 旦 
4; 也 就 是 ， 结 果 是 5 〈3-4-5 直 角 三 角形 的 斜 边 ) 。 当 测试 一 个 函数 
时 ， 事 先知 道 正确 的 结果 是 很 有 用 的 。 


到 这 个 时 候 我 们 已 经 确认 函数 的 语法 形式 是 正确 的 ， 紧 接着 可 以 
给 函数 体 添 加 代码 了 。 合 理 的 下 一 个 步骤 旦 找到 距离 关 x。 -x 1 和 y , 一 
。 下 一 版 本 的 函数 将 这 两 个 距离 差 保存 到 临时 变量 中 并 打印 出 来 。 


def es y1, x2, y2): 
dx = x2 - 
dy = y2 - 1 
print('dx is', dx) 


print('dy is', dy) 
return 0.0 


如 果 函 数 正 确 执行 ， 应 该 会 显示 ‘dx is 3 和 dy is 4 。 如 
果 确 实 如 此 ， 我 们 就 可 以 确认 函数 正确 地 获得 了 实 参 ， 并 正确 地 执行 
了 第 一 步 计 算 。 如 果 不 是 如 此 ， 则 只 有 几 行 代码 需要 检查 。 


下 一 步 我 们 计算 dx 和 dy 的 平方 和 : 


def distance(x1, yi, x2, y2): 
dx = x2 - x1i 
dy = y2 - y1 


dsquared = dx**2 + dy**2 
print('dsquared is: ', dsquared) 
return 0.0 


同样 地 ， 你 可 以 在 这 里 再 运行 一 所 程序 ， 并 检查 输出 (应 该 是 
25) 。 最 后 ， 可 以 使 用 math. sqrt 来 计算 并 返回 结果 : 


distance(xi1i, y1, x2, y2): 
dx = x2 - x1i 
dy = y2 - yi 
dsquared = dx**2 + dy**2 


result = math.sqrt(dsquared) 
return result 


如 果 这 个 函数 运行 正确 ， 那 么 你 的 任务 就 完成 了 。 否 则 ， 你 可 能 
需要 在 return 语句 之 前 打印 出 result 的 值 。 


最 终 版 本 的 函数 运行 时 并 不 打印 任何 东西 ; 它 只 会 返回 一 个 值 。 
我 们 之 前 写 的 print 语句 在 调试 时 很 有 用 ， 但 一 旦 你 的 函数 编写 正 
确 ， 就 应 该 删除 掉 它 们 。 这 种 代码 称 为 脚手架 代码 〈scaffolding) ， 
为 它们 在 构建 程序 的 过 程 中 很 有 用 ， 但 并 不 是 最 终 产 品 的 一 部 分 。 


开始 的 时 候 ， 应 当 每 次 只 添加 一 到 两 行 代码 。 当 你 获得 更 多 经 验 
之 后 ， 就 会 发 现 自己 可 以 编写 和 调试 更 多 的 代码 了 。 不 论 如 何 ， 增 量 
开发 都 能 帮 你 节省 大 量 的 调试 时 间 。 


这 个 过 程 有 以 下 几 个 关键 点 。 


1， 以 一 个 可 以 正确 运行 的 程序 开始 ， 每 次 只 做 小 的 增 量 修改 。 如 
果 在 任意 时 刻 发 现 错误 ， 你 都 应 当知 道 错 在 哪里 。 


2. 使 用 临时 变量 保存 计算 的 中 间 结 采 ， 你 可 以 显示 和 检查 它们 。 


3. 一 旦 整个 程序 完成 ， 你 可 能 会 想 要 删除 掉 某 些 脚手架 代码 或 者 
把 多 个 语句 综合 到 一 个 复杂 和 玫 达 式 中 。 但 只 在 不 会 增加 代码 阅读 的 难 
度 时 才 应 该 那么 做 。 


作为 练习 ， 使 用 增 量 开 发 来 编写 一 个 函数 hypotenuse ， 给 定 直 
角 三 角形 的 另外 两 个 直角 边 的 长 度 时 ， 它 返回 斜 边 的 长 度 。 开 发 过 程 
中 ， 记 孙 每 一 步 的 情况 。 


6.3 组合 


你 可 能 已 经 想到 ， 在 一 个 画 数 中 可 以 调用 男 外 一 个 钞 数 。 作 为 示 
例 ， 我 们 会 写 一 个 函数 ， 它 接收 两 个 点 ， 圆 心 和 辆 周 上 的 一 点 ， 并 计 
算 圆 的 面积 。 


假设 圆心 保存 在 变量 xc 和 yc 中 ， 而 圆周 上 的 点 保存 在 xp 和 yp 
上 。 第 一 步 是 算出 圆 的 半径 ， 也 就 是 这 两 个 点 的 距离 。 我 们 刚才 已 经 
写 了 一 个 函数 ，distance ， 正 好 有 这 个 功能 : 


radius = distance(xc, yc, xp, yp) 


二 步 是 使 用 上 一 步 算出 来 的 半径 来 计算 圆 的 面积 。 我 们 刚才 也 
三 ww 


result = areal(radius ) 


将 这 两 步 封 小 成 一 个 芳 数 ， 我 们 得 到 |: 


def circle area(xc, yc, xp, yp): 
radius = distance(xc, yc, xp, yp) 
result = area(radius) 


return result 


临时 变量 radius 和 result 在 开发 和 调试 时 有 用 ， 可 一 旦 程序 已 
经 可 以 正确 运行 ， 我 们 就 可 以 使 用 函数 组 合 来 简化 函数 : 


def circle area(xc, yc, xp, yp): 
return area(distance(xc, yc, xp, yp)) 


6.4 布尔 函数 


函数 可 以 返 回 布尔 值 ， 这 样 可 以 很 方便 地 隐 尖 画 数 内 复杂 的 检 
def is divisible(x, y): 


if x %Yy == 0: 
return True 


else: 
return False 


通常 布尔 函数 的 命名 都 类 似 于 是 /和 否 的 问 句 。is_divisible 返回 
True 或 False ， 表 示 X 是 否 可 以 被 y 整除 。 


这 里 是 一 个 例子 : 


>>> is_divisible(6, 4) 
False 
>>> is_divisible(6, 3) 


True 


== 操作 符 的 结 采 是 一 个 布尔 值 ， 所 以 我 们 可 以 把 这 个 钞 数 写 得 更 
加 紧凑 : 


def is_divisible(x, y): 
return x %Yy == 0 


布尔 函数 第 利用 在 条 件 语句 中 : 


if is_divisible(x, y): 
print('x is divisible by y') 


你 可 能 想 这 么 写 : 


if is_divisible(x, y) == True: 
print('x is divisible by y') 


但 这 里 多 出 来 的 比较 是 不 必要 的 。 


作为 练习 ， 写 一 个 函数 is_between(X，y，Z) ， 当 x <y <z 时 ， 
返回 True ， 其 他 情况 返回 False 。 


6.5 “再 谈 递 归 


至 今 为 止 ， 我 们 只 涉及 Python 的 一 个 很 小 的 于 集 ， 但 你 可 能 会 有 兴 
趣 知 道 ， 这 个 子 集 已 经 是 一 个 完备 的 编程 语言 ， 也 就 是 说 ， 任 何 可 以 
计算 的 问题 ， 都 可 以 用 这 个 子 集 语言 来 完成 。 任 何 已 有 的 程序 ， 都 可 
以 用 现在 已 经 学 会 的 语言 特性 重 写 出 来 (实际 上 ， 可 能 还 需要 一 些 命 
令 来 控制 诸如 键盘 、 鼠 标 、 光 盘 之 类 的 设备 ， 但 仅 此 而 已 ) 。 


要 证 明 这 个 论断 ， 并 不 是 简单 的 工作 。 这 个 证 明 最 早 是 由 第 一 代 
计算 机 科学 家 之 一 阿兰 .图 灵 (Alan Turing) 完成 的 《有 人 会 争辩 他 其 
实 是 个 数学 家 ， 但 大 部 分 早期 的 计算 机 科学 家 都 是 从 数学 家 开始 
的 ) 。 因 此 ， 这 被 称 为 图 灵 论 题 (Turing Thesis) 。 若 想 了 解 天 于 图 灵 
论题 的 更 完整 (更 准确 ) 的 讨论 ， 我 推荐 Michael Sipser 的 《计算 理论 
导 引 》 (Introduction to the Theory of Computation ，Course 


Technology，2012) 一 书 。 


为 了 初步 了 解 如 何 使 用 我 们 现在 学 会 的 工具 ， 可 以 考虑 儿 个 递归 
定义 的 数学 钞 数 。 如 归 定 义 和 循 环 定义 有 些 相 似 ， 因 为 同样 地 ， 定 义 
中 都 会 包 侣 要 定义 的 事物 本 喘 。 真 正 的 循环 定义 往往 没什么 用 : 


vorpal: 
一 个 形容 词 ， 用 来 揪 述 一 个 vorpal 的 事物 。 


如 采 你 在 词典 中 看 到 这 样 的 定义 ， 可 能 会 感觉 恼怒 。 男 一 方面 ， 
如 果 你 查看 阶乘 函数 (用! 表示) 的 定义 ， 可 能 会 看 到 如 下 内 容 : 


0!= 工 


n!=n(n-1)! 


这 个 定义 说 明 0 的 阶乘 是 1， 而 任意 其 他 值 n 的 阶乘 是 n -1 的 阶乘 乘 
Dn 。 


所 以 3! 是 3 乘 以 2!1， 而 2! 是 2 乘 以 1!， 而 1! 是 1 乘 以 0!。 综 合 起 来 ，3! 
等 于 3 乘 以 ?2 乘 以 1 乘 以 1， 即 6。 


CR ea ee 那么 也 可 以 使 用 Python 程 
序 来 计算 它 。 第 一 步 是 决定 使 用 什么 形 参 。 在 这 个 例子 里 ， 很 明显 函 
eg 需要 一 个 整数 形 参 


def factorial(n): 


如 采 实 参 正好 是 0， 我 们 只 需要 直接 返 


def ny 
if n == 


nt 1 


否则 ， 接 下 来 是 有 意思 的 地 方 ， 我 们 需要 递归 调用 函数 来 计算 n -1 
的 阶乘 ， 并 乘 以 mn : 


def factorial(n): 
if Nn == 0: 
return 1 
else: 
recurse = factorial(n-1) 


result = n * recurse 
return result 


这 个 程序 的 运行 流程 和 5.8 节 里 的 countdown 函数 类 似 。 如 果 我 
们 使 用 实 参 值 3 调用 factorial : 


因为 3 不 是 0， 我 们 使 用 第 二 个 分 文 ， 计算 n-1 的 阶乘 .…… 
因为 2 不 是 0， 我 们 使 用 第 二 个 分 文 ， 计算 n-1 的 阶乘 .…… 


因为 1 不 是 90， 我 们 使 用 第 二 个 分 文 ， 计算 n-1 的 阶乘 .…… 


因为 0 等 于 0， 我 们 使 用 第 一 个 分 文 并 返回 1， 不 再 需要 进 
行 任何 递归 调用 了 。 


返回 值 (1) 乘 以 n=1 ， 结 果 返 回 。 
返回 值 (1) 乘 以 n=2 ， 结 果 返 回 。 


返回 值 (2) 乘 以 n=3 ， 结 果 是 6， 而 这 个 结果 就 是 整个 函数 的 返 
回 值 。 


图 6-1 显 示 了 这 一 系列 函数 调用 的 栈 图 。 


mr 


factorial n 一 :3 recurse —= 2 result 一 = 6 
factorial n 一 :2 recurse 一 = 1 result 一 = 2 
factorial n 一 :1 recurse 一 = 1 result —= 1 


factorial n 一 > 0 


图 6-1 栈 图 


结果 值 在 图 中 显示 为 沿 着 栈 同 上 回 传 。 在 每 个 帧 中 ， 返 回 值 是 
result 的 值 ， 即 n 和 recurse 的 乘积 。 


最 后 一 帧 中 ， 局 部 变量 recurse 和 result 不 存在 ， 因 为 新 建 它 
们 的 分 支 并 没有 运行 。 


6.6 ”坚持 信念 


跟踪 程序 执行 的 流程 是 阅读 程序 的 一 个 办 法 ， 但 那样 很 快 就 会 陷 
入 迷宫 境况 。 另 外 有 个 办 法 ， 我 称 为 "坚持 信念 ”。 在 遇 到 一 个 函数 调 
用 时 ,不 去 跟踪 执行 的 流程 ， 而 假定 函数 是 正确 工作 的 ， 能 够 返回 正 
确 的 结 


事实 上 ， 在 使 用 内 置 画 数 时 ， 你 已 经 在 这 样 党 试 着 坚持 信念 了 。 
当 调用 math .cos 或 math .exp 时 ， 你 并 不 去 检查 那些 函数 的 内 部 实 


现 。 你 只 会 假定 它们 十 正确 的 ， 因 为 写 这 些 内 置 画 数 的 一 定 是 很 优秀 
的 程序 员 。 


当 调 用 自己 写 的 函数 时 ， 这 个 道理 也 成 立 。 例 如 ， 在 6.4 节 中 ， 我 
们 写 了 is_divisible di ee 
除 。 定 这 个 画 妆 前 过 检查 代码 和 测 
试 一 一 就 可 以 直接 使 用 它 ， 而 不 需要 再 细 看 内 部 实现 了 。 


对 递归 函数 来 说 ， 也 是 如 此 。 当 调用 递归 函数 时 ， 不 需要 检查 执 
行 的 流程 ， 你 应 该 假定 递归 调用 是 正确 的 〈 返 回 正确 的 结果 ) ， 并 问 
目 己 : “假设 我 能 够 正确 得 到 n -1 的 阶乘 ， 如 何 计 算 n 的 阶乘 ? ”很 明显 
你 可 以 做 到 ， 直 接 乘 以 n 即 可 。 


当然 ， 在 还 没有 完成 函数 的 编写 时 ， 就 假设 它 能 正确 工作 ， 看 起 
来 有 些 奇 怪 ， 但 那 也 正 是 为 什么 我 称 它 为 “坚持 信念 ”的 原因 ! 


6.7” 男 一 个 示例 


除 阶乘 factorial 之 外 ， 最 
(fibonacci ) ， 其 定义 如 下 ( 


http://en.wikipedia.org/wiki/Fibonacci_number) : 


参见 


香 见 的 递归 数学 定义 羡 辈 波 那 契 数列 


fibonacci(0) = 0 
fibonacci (1) = 1 


fibonacci (n ) = fibonacci (n - 1) + fibonacci (n - 2) 


翻译 成 Python 后 ， 看 起 来 是 这 样 : 


def fibonacci (n): 
if Nn == 0: 

return 0 

elif n == 1: 

return 1 


else: 
return fibonacci(n-1) + fibonacci(n-2) 


如 果 你 在 这 里 试图 跟踪 执行 的 流程 ， 即 使 是 很 小 的 参数 n ， 都 会 感 
觉 头 都 要 炸 了 。 但 因为 坚持 信念 ， 如 采 你 假定 两 个 递归 调用 都 正音 工 
作 ， 那 么 很 明显 ， 把 它们 加 到 一 起 必然 得 到 正确 的 结 


6.8 ”检查 类 型 


如 果 我 们 调用 factorial 函数 ， 并 给 定 1.5 作 为 实 参 ， 会 发 生 什 
么 呢 ? 


>>> factorial(1.5) 
RuntimeError: Maximum recursion depth exceeded 


看 起 来 像 是 无 限 递归 。 怎 么 会 这 样 ? 本 Ra 一 个 基准 情形 
当 n == 0 时。 但 如 果 n 不 是 整数 ， 我 们 就 可 能 错过 这 个 基准 情形 ， 
而 永远 递归 下 去 。 


在 第 一 个 递归 调用 中 ,mn 和 是 0.5。 第 二 个 , n 是 -0.5°。 从 此 以 后 , 它 
会 越 来 越 小 (更 小 的 负数 ) ， 但 永远 不 会 变 成 0。 


我 们 有 两 个 选择 。 可 以 尝试 汉化 函数 factorial ， 使 之 能 正确 处 
理 浮 点 数 ， 或 者 我 们 也 可 以 让 factorial 检查 其 实 参 的 类 型 。 第 一 个 
选择 在 数学 上 叫 作 伽 玛 函数 (gamma function) ， 它 有 些 超出 了 本 书 的 
范围 。 所 以 我 们 选择 第 二 个 。 


我 们 可 以 使 用 内 置 画 数 isinstance 来 检查 实 参 的 类 型 。 与 此 同 
时 ， 我 们 也 可 以 确保 实 参 是 正 数 ; 


def factorial (n): 
if not isinstance(n, int): 
print('Factorial is only defined for integers.') 
return None 
elif n < 0: 
print('Factorial is not defined for negative integers.') 


return None 
elif n == 0: 
return 1 
else: 
return n * factorial(n-1) 


第 一 个 基准 情形 处 理 非 整 数 ， 第 二 个 处 理 人 负数。 这 两 种 情况 中 ， 
程序 打印 一 个 错误 信息 ， 并 返回 None ， 表 示 出 现 了 问题 : 


>>> factorial( 'fred ') 

Factorial is only defined for integers. 
None 

>>> factorial( -2) 


Factorial is not defined for negative integers. 
None 


如 果 我 们 通过 了 这 两 个 测试 ， 就 能 确保 知道 n 是 正 数 或 9， 所 以 我 
们 可 以 证 明 递归 必然 终结 。 


这 个 程序 演示 了 一 个 模式 ， 它 有 时 被 称 为 守卫 (guardian) 。 前 两 
个 条 件 惑 像 守 卫 一 样 ， 傈 护 后 面 的 代码 ， 以 免 出 现 错误 。 和 守卫 使 得 证 
明代 码 的 正确 性 成 为 可 能 。 


在 11.3 广 中 我 们 会 看 到 一 个 更 灵活 的 方案 ， 用 以 打印 错误 信息 : 抛 


国语 小 异 司 ” 


6.9 ”调试 


将 一 个 大 程序 分 解 为 小 函数 ， 目 然而 然 地 引入 了 调试 的 检查 点 。 
如 果 一 个 函数 不 能 正 第 工作 ， 可 以 考虑 3 种 可 能 性 。 


函数 获得 的 实 参 有 问题 ， 某 个 前 置 条 件 没 有 达到 。 
。 函数 本 刁 有 问题 ， 菏 个 后 置 条 件 没有 达到 。 
函数 的 返回 值 有 问题 ， 或 者 使 用 的 方式 不 正确 。 


要 排 除 第 一 种 可 能 ， 可 以 在 图 数 开始 的 地 方 加 上 print 语句 ， 显 
示 实 参 的 值 (以 及 它们 的 类 型 )。 或 者 可 以 添加 代码 来 显 式 地 检查 前 
站 做作 


如 果实 参看 起 来 没 错 ， 在 每 个 return 语句 前 添加 print 语句 ， 
显示 返回 值 。 如 果 有 可 能 ， 手 动 检查 返回 值 。 考 虑 使 用 能 更 容易 检验 
结果 的 实 参 来 调用 函数 ， 就 像 6.2 节 中 的 那样 。 


如 有 果 函 数 看 起 来 正常 ， 检 查 调 用 它 的 代码 ， 确 保 返 回 值 被 正确 使 
用 (或 者 确实 被 使 用 了 ! ) 。 


在 函数 的 开端 和 结尾 处 增加 print 语句 ， 能 帮助 我 们 更 清晰 地 了 
解 函 数 的 执行 流程 。 例 如 ， 这 里 是 一 个 添加 了 print 语句 的 
factorial 函数 : 


def factorial(n): 
Space = " '"* (4*n) 
print(space, 'factorial', n) 
if Nn == 0: 
print(space, 'returning 1°') 
return 1 


else: 
recurse = factorial(n-1) 
result = n * recurse 
print(space, 'returning', result) 
return result 


space 是 一 个 字符 串 ， 包 含 多 个 空格 ， 用 来 控制 输出 内 容 的 缩 
进 。 下 面 是 调用 factorial(4) 的 结果 : 


factorial 4 
factorial 3 
factorial 2 
factorial 1 
factorial 0 


returning 1 
returning 1 
returning 2 
returning 6 
returning 24 


如 有 条 你 对 函数 调用 的 流程 有 困惑 ， 这 种 输出 可 以 帮 你 。 开 发 有 效 
的 脚手架 代码 需要 人 花费 时 间 ， 但 一 点 点 脚手架 可 以 节省 大 量 的 调试 。 


6.10 ”术语 表 


临时 变量 (temporary variable) : 在 复杂 计算 中 用 于 保存 中 间 计 算 
值 的 变量 。 


无 效 代码 (dead code) : 程序 中 的 一 些 人 代码， 永远 不 可 能 运行 。 
常常 是 写 在 return 语句 之 后 的 代码 。 


增 量 开 发 (incremental development) : 一 个 程序 开发 计划 ， 通 过 
每 次 只 增加 少量 代码 ， 并 加 以 测试 的 步骤 ， 来 减少 调试 。 


脚手架 代码 《scaffolding) : 在 开发 过 程 中 使 用 的 ， 但 在 最 终 版 本 
中 不 需要 的 代码 。 


守卫 (guardian) : 一 个 编程 模式 。 使 用 条 件 语 句 来 检查 并 处 理 可 
能 产生 错误 的 情形 。 


6.11 练习 


AM 6-1 


为 下 面 的 程序 绘制 一 个 栈 图 。 程 序 的 输出 是 什么 ? 


def b(z): 
prod = a(z, 2z) 
print(z, prod) 
return prod 


def a(x, y): 
Xx=x+1 
return x * y 


def c(x, y, Zz): 
total =x+y+z 
Square = b(total)**2 
return square 


X = 工 
y=x+1 
print c(x, y+3, x+y) 


练习 6-2 


Ackermann 函 数 ，A (m,n )， 定 义 如 下 : 


n+l ifm=0 
A(m.n)=4 A(m—1.1) ifm>0andn=0 
A(m—l1.A(m.n—l1)) fm>0andn>0 


参考 http://en.wikipedia.org/wiki/Ackermann_function。 编写 一 个 妙 
数 ack ， 计 算 Ackermann 函 数 鸭 值 。 使 用 你 的 函数 求 ack(3，4) 的 
值 ， 它 应 当 是 125。 对 于 很 大 的 数字 m 和 n ， 会 发 生 什么 ? 


解答 : http://thinkpython2.com/code/ackermann.py ° 
练习 6-3 


回 文 是 一 个 正 同 和 逆 同 拼写 都 相同 的 单词 ， 例 
如 “noon” 和 “redivider”。 递 归 地 说 ， 如 果 一 个 单词 第 一 个 和 最 后 一 个 字 
母 相 同 ， 并 且 中 间 是 一 个 回 文 ， 则 该 单词 是 回 文 。 


下 面 的 范 数 接收 一 个 字符 串 形 参 并 返回 第 一 个 、 最 后 一 个 以 及 中 
间 的 字母 : 


def first(word ) : 
return word[0] 


def last(word ) : 
return word[-1] 


def middle(word): 
return word[1:-1] 


在 第 8 章 中 得 看 它们 是 如 何 使 用 的 。 


1. 将 这 些 函 数 保存 到 一 个 文件 palindrome ,py 中 并 测试 它们 。 
如 果 你 使 用 一 个 包含 两 个 字母 的 字符 串 调用 middle ， 会 发 生 什么 ? 使 
用 一 个 字母 呢 ? 空 字符 串 呢 ? 空 字符 串 写 作 ' “并且 不 包含 任意 字母 。 

2， 编写 一 个 函数 is_palindrome ， 接 收 一 个 字符 串 形 参 ， 并 当 


它 是 回 文 的 时 候 返 回 True ， 否 则 返回 False 。 记 着 你 可 以 使 用 内 置 
函数 len 来 检测 字符 串 的 长 度 。 


解答 : http://thinkpython2.com/code/palindrome_soln.py ° 
AM 对 6-4 


我 们 说 一 个 数 a 是 b 的 乘 方 ， 如 果 a 可 以 被 b 整除 ， 并 且 a/b 也 是 b 
的 乘 方 。 编 写 一 个 函数 is_power 接收 形 参 a 和 b ， 当 a 是 b 的 乘 方 时 
返回 True 。 注 意 : 你 需要 考虑 基准 情形 。 


练习 6-5 


a 和 的 最 大 公约 数 (GCD) 是 它们 两 个 都 能 整除 的 最 大 的 数 。 


寻找 两 个 数 的 最 大 公约 数 的 方法 之 一 是 基于 如 下 观察 : 如果 r 是 a 
除 以 b 的 余数 ， 则 gcd(a ,b ) = gcd(b ,r )。 作 为 基准 情形 ， 我 们 可 以 使 
用 gcd(a ,0)=a。 


编写 一 个 画 数 gcd ， 接 收 形 参 a 和 b ， 并 返回 它们 的 最 大 公约 数 。 


鸣谢 : 这 个 练习 是 基于 Abelson 和 Sussman 的 《计算 机 程序 的 构造 
和 解释 》 (Structure and Interpretation of Computer Programs ) (MIT 出 
版 社 ，1996) 一 书 。 


第 7 章 ”和 迭代 


本 章 讲 关于 和 迭代 的 话题 。 迭 代 即 重复 运行 一 段 代 码 语句 块 的 能 
力 。 我 们 在 5.8 市 见 过 一 种 使 用 递归 来 进行 的 迭代 ， 在 4.2 节 中 见 过 男 一 
种 使 用 for 循环 进行 的 迭代 。 在 本 划 中 我 们 将 会 看 到 使 用 while 循环 
进行 的 第 三 种 述 代 。 前 先 我 们 先进 一 步 讲 讲 变 量 赋值 的 话题 。 


7.1 重新 赋值 


你 应 当 已 经 发 现 ， 对 一 个 变量 进行 多 次 赋值 是 合法 的 。 新 的 赋值 
语句 使 现 有 的 变量 引用 一 个 新 值 〈 并 不 再 引用 老 值 ) 。 


因为 第 一 次 显示 Xx 时， 它 的 值 是 5， 而 第 二 次 时 它 的 值 是 7。 


图 7-1 显 示 了 在 状态 图 中 ， 重 新 赋值 是 什么 样子 的 。 


图 7-1 状态 图 


在 这 里 我 想 解 释 一 个 常见 的 误区 。 因 为 Python 使 用 等 号 《= ) 来 
表示 赋值 ， 故 很 容易 将 a = b 这 样 的 赋值 语句 错误 理解 为 数学 中 表示 
a 和 b 相等 的 命题 。 这 样 理解 是 错误 的 。 


首先 ， 相 等 判断 是 个 对 称 的 关系 ， 而 赋值 并 不 是 。 例 如 ， 在 数学 
中 ， 如 果 a =7 那 么 7=a。 但 是 在 Python 中 ， 语 句 a = 7 是 合法 的 ， 但 7 
= a 则 是 非法 的 。 


另外 ， 在 数学 中 ， 一 个 相等 判断 的 命题 总 是 非 真 即 假 。 如 采 现 在 a 
=b ， 那 么 a 总 会 等 于 。 在 Python 中 ， 赋 值 语句 会 让 两 个 变量 变 得 相 
等 ， 但 它们 并 不 会 总 保持 那个 状态 : 


# a 和 b 现 在 相 和 
# a 和 b 不 再 相 和 


第 三 行 修改 a 的 值 ， 但 是 并 不 会 修改 b 的 值 ， 所 以 它们 不 再 相 


和 。 
于 


虽然 重新 赋值 常常 很 有 用 处 ， 但 是 应 该 谨慎 使 用 。 如 果 变 量 的 值 
经 常 变化 ， 会 导致 程序 难以 阅读 和 调试 。 


7.2 ”更 新 变量 


重新 赋值 的 最 常见 形式 是 更 新 ， 此 时 变量 的 新 值 依赖 于 旧 值 。 


>>>x=x+1 


这 个 语句 的 意思 是 “获取 x 的 当前 值 ， 加 一 ， 再 更 新 x 为 此 新 
值 ”。 


如 果 壬 试 更 新 一 个 并 不 存在 的 变量 ， 则 会 得 到 错误 ， 因 为 Python 
在 赋值 给 x 之 前 会 先 计 算 等 号 右边 的 部 分 : 


>>>x=x+1 
NameError: name 'x' is not defined 


在 更 新 变量 之 前 ， 必 须 先 对 它 进行 初始 化 。 通 常 通过 一 个 简单 赋 
值 操作 来 进行 初始 化 : 


通过 加 1 来 更 新 一 个 变量 ， 称 为 增 量 (increment) ; 减 1 的 操作 称 
为 减 量 (decrement) 。 


7.3 ”while 语句 
计算 机 常 被 用 来 自动 化 重复 处 理 某 些 任务 。 重 复 执行 相同 或 相似 


的 任务 ， 而 不 犯错 误 ， 这 是 电脑 所 擅长 于 人 之 处 。 在 计算 机 程序 中 ， 
重复 也 被 称 为 和 代 。 


我 们 之 前 已 经 看 到 两 个 函数 countdown 和 print_n ， 它 们 使 用 


递归 来 进行 迭代 操作 。 由 于 和 迭代 如 此 常见 ，Python 提 供 了 语言 特性 来 


文 持 它 。 其 中 一 个 是 我 们 在 4.2 市 中 见 过 的 for 循环 语句 。 后 面 我 们 会 
再 回 到 这 个 话题 。 


男 一 个 则 是 while 语句 。 下 面 是 使 用 while 语句 实现 的 


countdown 函数 : 


def countdown(n): 
while n > 0: 
print(n) 


n=n-1 
print('Blastoff!"') 


你 基本 上 可 以 按照 英语 来 理解 while 语句 。 它 的 意思 是 : “每 当 n 
还 大 于 0 时 ， 显 示 n 的 值 ， 并 将 n 减 1°。 当 n 变 成 0 的 时 候 ， 显 示 单 词 
Blastoff! 。?” 


用 更 正式 的 说 法 ， 下 面 是 while 语句 执行 的 流程 。 


1， 确定 条 件 是 真 还 是 假 。 


2. 如 果 条 件 为 假 ， 退 出 while 语句 ， 并 继续 执行 后 面 的 语句 。 
3. 如 果 条 件 为 真 ， 则 运行 while 语句 的 语句 体 ， 并 返回 第 1 步 。 


这 种 类 型 的 流程 称 为 循环 〈loop) ， 因 为 第 3 步 又 循环 返回 到 最 项 
端的 第 1 步 了 。 


循环 的 语句 体 里 面 应 当 修 改 一 个 或 多 个 变量 的 值 ， 以 致 循环 的 条 
件 最 终 能 变 成 假 ， 而 退出 循环 。 人 否则 这 个 循环 会 永远 重复 下 去 ， 这 样 


的 情况 叫 作 无 限 循 环 。 计 算 机 科学 家 在 读 到 洗 发 液 的 说 明 * 涂 抹 、 神 
洗 、 重 复 " 时 ， 总 会 感到 有 趣 ， 因 为 这 是 一 个 无 限 循环 。 


在 countdown 这 个 例子 里 ， 我 们 可 以 证 明 循环 必然 终结 : 如 采 n 
征 0 或 负数 ， 该 循环 从 不 运行 。 否 则 ，n 的 值 都 会 减 小 ， 因 此 最 终 n 会 
变 成 0。 


对 于 有 荣 些 循环 ， 束 并 不 一 定 那 么 容易 判断 了 。 例 如: 


def sequence(n): 
while n != 1: 
print(n) 
if n % 2 == 0: 


n=n/2 
else: 
n= n*3+1 


这 个 循环 的 条 件 是 n != 1 ， 所 以 只 要 n 还 没有 变 成 1 而 导致 条 件 
变 假 ， 循 环 就 会 一 直 进 行 下 去 。 


每 一 个 循环 中 ， 程 序 输出 n 的 值 ， 并 检查 它 是 偶数 还 是 奇数 。 如 
果 是 偶数 ，n 会 除 以 2。 如 果 是 奇数 ，n 会 被 奉 换 为 n*3+1。 例 如 ， 如 
果 传 入 sequence 函数 的 参数 是 3， 则 n 的 结果 值 是 : 3, 10, 5, 16, 8, 4， 
2,1° 


因为 n 有 时 候 增 加 ， 有 了 时候 减少 ， 没 有 办 法 找到 明显 的 证 据 确 定 n 
一 定 会 最 终 变 成 1， 或 者 说 程序 会 终止 。 对 于 某 些 特定 的 n 值 ， 我 们 可 
以 证 明 最 终 会 终止 。 例 如 ， 如 条 开始 的 参数 值 是 2 的 需 方 ， 则 每 次 循环 


n 都 是 偶数 ， 直 到 变 成 1。 前 面 的 例子 中 有 一 部 分 就 是 这 样 的 序列 ， 以 
16 开 始 。 


但 困难 的 问题 是 ， 我 们 是 否 能 够 证 明 这 个 程序 对 所 有 的 正 值 n 都 
可 以 最 终 终 止 。 人 至 今 为 止 ， 还 没有 人 对 这 个 问题 给 出 证 明 或 证 盆 ! 
(参见 http://en.wikipedia.org/wiki/Collatz_ conjecture) 


作为 练习 ， 重 写 5.8 节 中 的 print_n 画 数 ， 使 用 循环 而 非 递归 来 
实现 。 


7.4 _ break 语句 


有 时 候 只 有 在 循环 语句 体 的 执行 途中 才能 知道 是 不 是 到 了 退出 循 
环 的 时 机 。 这 时 候 可 以 使 用 break 语句 来 跳出 循环 。 


例如 ， 假 设 你 想 要 获得 用 户 输入 ， 直 到 他 们 输入 done 。 可 以 这 
5: 


while True : 
line = input('> ') 
if line == 'done': 
break 
print(line) 


print('Done!') 


循环 的 条 件 是 True ， 总 是 为 真 ， 所 以 循环 会 一 直 运 行 ， 直 到 过 
到 break 语句 。 


每 次 循环 之 内 ， 都 会 多 用 一 个 尖 括 号 (> ) 来 提示 用 户 输入 。 如 
果 用 户 输入 done ，break 语句 会 退出 循环 。 否 则 程序 会 显示 出 用 户 
输入 的 内 容 ， 并 重新 回 到 循环 的 顶端 。 这 里 是 一 个 运行 的 实例 : 


> not done 


这 种 写 while 循环 的 方式 很 常见 ， 因 为 可 以 把 判断 循环 条 件 的 有 逻 
辑 放 在 循环 中 的 任何 地 方 (而 不 只 是 在 顶端 ， 并 且 可 以 以 肯定 的 语 
气 来 表示 终结 条 件 (“ 当 这 样 发 生 时 停止 循环 ”) ， 而 不 是 否定 的 语气 
(“继续 执行 ， 直 到 那个 条 件 发 生 ”) 。 


7.5 ”平方根 


程序 中 常常 使 用 循环 来 进行 数值 计算 ， 以 一 个 近似 值 开 始 ， 并 和 迭 
代 地 优化 计算 结果 。 


例如 ， 计 算 平 方 根 的 方法 之 一 是 牛顿 方法 。 假 设 你 想 要 知道 a 的 
平方 根 。 如 果 你 以 任意 一 个 估计 值 x 开始 ， 可 以 使 用 如 下 的 方程 获得 
一 个 更 好 的 估计 值 。 


>>> y 
2.16666666667 


这 个 结果 更 接近 正确 的 答案 (v4=2) 。 如 果 我 们 使 用 新 的 估计 
值 重 复 这 个 过 程 ， 会 得 到 更 近似 的 结 


—Y 
= (x + a/x) /2 


通常 来 说 ， 我 们 并 不 能 提前 知道 需要 多 少 步 才能 得 到 正确 的 管 
征 当 估计 值 不 再 变化 时 ， 我 们 束 知 道 达到 目的 了 。 


y 
(x + a/x) / 2 


y 
(x + a/x) / 2 


当 y == X 时 ， 可 以 终止 。 下 面 是 一 个 以 佑 计 值 x 开始 ， 并 不 断 
迭代 优化 直到 它 不 再 变化 的 循环 : 


while True : 
print(x) 


对 于 大 多 数 a 值 来 说 ， 这 样 效果 很 好 ， 但 通常 来 说 ， 测 试 float 
的 相等 是 危险 的 。 浮 点 数值 只 是 近似 正确 : 大 部 分 有 理 数 ， 如 1/3， 以 
及 无 理 数 ， 如 v2 ， 都 不 能 用 float 精确 表示 。 


比 起 判断 x 和 y 十 否 精确 相等 ， 更 安全 的 方式 是 利用 内 置 函 数 abs 
来 计算 它们 之 间 差 值 的 绝对 值 ， 或 者 说 量 级 : 


if abs(y-X) < epsilon: 
break 


这 里 epsilon 的 值 是 0.0000001， 用 来 决定 近似 度 是 足够 的 。 
7.6 算法 


牛顿 方法 是 算法 的 一 个 例子 : 它 是 解决 一 类 问题 的 机 械 化 过 程 
(在 这 个 例子 里 ， 问 题 是 计算 平方 根 ) 。 


要 理解 算法 是 什么 ， 从 一 个 算 不 上 算法 的 东西 开始 可 能 更 简单 。 
在 学 习 个 位 数 相 乘 时 ， 你 可 能 表 育 过 乘法 表 。 实 际 上 ， 你 记 住 了 100 个 
等 别 的 答案 。 这 种 知识 不 算是 算法 。 


但 是 ， 如 果 你 比较 “ 懒 >， 可 能 已 经 学 会 了 一 些小 技巧 来 偷懒 。 例 
如 ， 要 计算 n 和 9 的 乘积 ， 你 可 以 写 下 n -1 作为 十 位 数 ，10-n 作为 个 位 


数 。 这 个 小 技巧 是 计算 任意 个 位 数 和 9 的 乘积 的 通用 方案 。 这 算是 一 个 
算法 ! 

相似 地 ， 你 学 过 的 进位 加 法 、 借 位 减法 以 及 长 除法 都 是 算法 。 算 
法 的 特点 之 一 是 它们 不 需要 任何 聪明 才智 就 能 执行 。 它 们 是 一 个 机 械 
化 的 过 程 ， 其 中 每 一 步 都 依照 一 组 简单 的 规则 接着 上 一 步 进 行 。 


执行 算法 非常 枯燥 ， 但 设计 算法 的 过 程 却 充满 趣味 和 智力 挑战 ， 
并 且 是 计算 机 科学 的 一 个 核心 部 分 。 


一 些 人 们 自然 而 然 、 毫 无 困难 或 者 下 意识 所 做 的 事情 ， 用 算法 表 
达 却 最 为 困难 。 理 解 自然 语言 是 一 个 好 例子 。 我 们 都 能 理解 自然 语 
言 ， 但 是 至 今 为 止 还 没有 人 能 解释 我 们 是 怎么 做 到 的 ， 至 少 没 办 法 用 
算法 解释 。 


7.7 调试 
当 你 开始 编写 更 大 的 程序 时 ， 常 常会 发 现 自己 花费 更 多 的 时 间 用 


于 调试 。 更 多 的 代码 意味 看 更 多 的 出 错 机 会 ， 以 及 更 多 可 能 隐藏 着 bug 
的 地 方 。 


削减 调试 时 间 的 方法 之 一 是 “二 分 调试 ” (debugging by 
bisection) 。 例 如 ， 如 果 你 的 程序 有 100 行 代码 ， 如 果 每 次 检查 一 行 ， 
需要 100 步 。 


相反 地 ， 可 以 芝 试 把 问题 分 成 两 半 。 找 到 程序 的 中 点 ， 或 者 接近 
那里 的 地 方 ， 找 一 个 可 以 检验 的 中 间 结 采 。 添 加 一 个 print 语句 (或 


者 其 他 的 可 以 有 检查 效果 的 代码 ) 并 运行 程序 。 


如 果 中 点 检验 的 结果 是 错误 的 ， 说 明 错误 必然 出 现在 程序 的 前 半 
部 分 。 如 果 是 正确 的 ， 那 错误 则 在 程序 的 后 半 部 分 。 


每 进行 一 次 这 样 的 检查 ， 就 减少 了 一 半 需 要 检查 的 代码 。 经 过 6 步 
之 后 (显然 少 于 100 步 ) ， 就 能 够 减少 到 一 至 两 行 代码 ， 至 少 理论 上 如 


ls 


实 路 中， 常常 很 难 确定 “程序 的 中 点 "在 哪里 ， 并 且 并 不 总 是 能 够 
检验 它 。 通 过 数 代码 行 数 来 确定 中 点 显然 没有 意义 。 相 反 地 ， 应 当 思 
考 程序 中 哪些 地 方 可 能 出 错 ， 哪 些 地 方 容易 加 上 一 个 检查 。 然 后 选择 
一 个 你 认为 在 其 前 后 发 生 错误 概率 差不多 的 点 进行 检查 。 


7.8 ”术语 表 


重新 赋值 (reassignment) : 对 一 个 已 经 存在 的 变量 赋予 一 个 新 
值 。 


更 新 update) : 一 种 赋值 操作 ， 新 值 依赖 于 变量 的 旧 值 。 


初始 化 ”(initialization) : 一 种 赋值 操作 ， 给 变量 一 个 初始 的 值 ， 
以 后 可 以 进行 更 新 。 


增 量 (increment) : 一 种 更 新 操作 ， 增 加 变量 的 值 (常常 是 加 
1) 。 


减 量 (decrement) : 一 种 更 新 操作 ， 减 少 变 量 的 值 。 


迭代 (iteration) : 使 用 递归 函数 调用 或 者 循环 来 重复 执行 一 组 


语句 。 
无 限 循环 (infinite loop) : 一 个 终止 条 件 永远 无 法 满足 的 循环 。 


算法 (algorithm) : 解决 一 类 问题 的 通用 过 程 。 
7.9 练习 


练习 7-1 


复制 7.5 节 的 循环 并 封装 到 一 个 名 为 sSquare_root 的 函数 中 ， 这 
个 函数 接收 一 个 形 参 a 。 选 择 一 个 合理 的 值 x ， 并 返回 a 的 平方 根 的 
估计 值 。 


要 测试 这 个 方法 ， 可 以 编写 一 个 名 为 test_square_root 的 函 
数 ， 打 印 下 面 这 样 的 表格 : 


9 


mysqrt(a) math. sqrt(a) diff 


1.41421356237 1.41421356237 

1.73205080757 1.73205080757 

2.0 2.0 

2.2360679775 2.2360679775 

2.44948974278 2.44948974278 

2.64575131106 2.64575131106 0.0 
2.82842712475 2.82842712475 4.4408920985e-16 
3.0 3.0 0.0 


1.0 
2.0 
3.0 
4.0 
5.0 
6.0 
7.0 
8.0 
9.0 


第 一 列 是 一 个 数 ，a ; 第 二 列 是 数 a 的 平方 根 ， 使 用 mysqrt 函数 
计算 ;第 三 ee sqrt 计算 出 的 平方 根 ， 第 四 列 是 两 种 计 


算 结 果 的 差 值 的 绝对 值 。 
练习 7-2 


内 置 画 数 eval 接收 一 个 字符 串 并 使 用 Python 解 释 右 对 它 进行 来 
值 。 例 如 : 


>>> eval('1+2* 3') 

7 

>>> import math 

>>> eval('math.sqrt(5)') 


2.2360679774997898 
>>> eval('type(math.pi)') 
<class 'float'> 


编写 一 个 钞 数 eval_1l0oop ， 和 迭代 地 提示 用 户 ， 接 收 他 们 的 输入 
并 使 用 eval 求 值 ， 并 打印 出 结 


它 应 当 一 直 继 续 ， 直 到 用 户 输入 'done' ， 并 返回 最 后 一 个 求 值 
的 表达 式 的 结果 。 


练习 7-3 


数学 家 拉 马 努 金 (Srinivasa Ramanujan) 找到 了 一 个 无 限 序列 ， 可 
以 用 来 生成 r 的 数值 近似 值 : 


en 


1 2VW2 (4£)!1(1103 + 26390#) 
n (k1) 3964 


编写 一 个 函数 estijmate_pi ， 使 用 这 个 公式 计算 并 返回 r 的 近似 
估计 。 它 应 当 使 用 一 个 while 循环 来 计算 求 和 的 每 一 项 ， 直 到 最 后 一 


项 的 值 小 于 le-15 〈 这 是 Python 对 10-5 的 标记 法 ) 。 你 可 以 通过 和 
math. pi 比较 来 检查 计算 的 结 


解答 : http://thinkpython2.com/code/pi.py° 


第 8 章 ”字符 串 


字符 串 和 整数 、 浮 点 数 以 及 布尔 类 型 者 不同。 字符 串 是 一 个 序列 
(sequence) ， 即 它 是 一 个 由 其 他 值 组 成 的 有 序 集合 。 本 章 中 你 将 见 到 
如 何 访问 构成 字符 串 的 各 个 字符 ， 并 学 到 字符 串 类 提供 的 一 些 方法 。 


8.1 字符 串 是 一 个 序列 


字符 串 是 一 个 字符 的 序列 (sequence) 。 可 以 使 用 方 括号 操作 符 
来 访问 字符 串 中 单独 的 字符 : 


>>> fruit = 'banana' 
>>> letter = fruit[1] 


第 二 个 语句 选择 fruit 中 的 第 1 个 字符 ， 并 将 它 赋值 给 letter 变 


方 括号 中 的 表达 式 称 为 下 标 (index) 。 下 标 表示 想 要 序列 中 的 哪 
一 个 字符 (所 以 用 index 这 个 名 称 ) 。 


但 你 可 能 发 现 得 到 的 和 预料 不 一 样 : 


Sa 


对 大 多 数 人 来 说 ，'banana' 的 第 一 个 字母 是 b ， 而 不 是 a。 但 对 
计算 机 科学 家 来 说 ， 下 标 表示 的 是 离 字 符 串 开头 的 偏 移 量 ， 而 第 一 个 
字母 的 偏 移 量 是 0。 


>>> letter = fruit[0] 
>>> letter 


bh! 


所 以 b 是 'banana' 的 第 0 个 字母 ，a 是 第 1 个 ，n 是 第 2 个 。 


可 以 使 用 包括 变量 和 操作 符 的 表达 式 作 为 下 标 。 


i=1 
fruit[i] 


fruit[i+1] 


但 下 标的 值 必须 是 整数， 否则 你 会 得 到 : 


>>> letter = fruit[1.5] 
TypeError: string indices must be integers 


8.2 len 


len 是 一 个 内 置 画 数 ， 返 回 子 符 串 中 学 符 的 个 数 : 


>>> fruit = 'banana' 
>>> len(fruit) 


要 获得 字符 串 的 最 后 一 个 字母 ， 你 可 能 会 想 这 么 写 : 


>>> length = len(fruit) 
>>> last = fruit[length] 


IndexError: string index out of range 


IndexError 出 现 的 原因 是 'banana' 中 没有 下 标 为 6 的 字母 。 
为 我 们 是 从 0 开始 计算 的 ，6 个 字母 的 下 标 是 0 到 5。 要 获得 最 后 一 个 字 
符 ， 需 要 从 length 里 减 1: 


>>> last = fruit[length-1] 
>>> last 


I'a! 


或 者 ， 你 可 以 使 用 负数 下 标 。 负 数 下 标 从 字符 串 结尾 处 倒 着 数 。 
表达 式 fruit[-1] 返回 最 后 一 个 字母 ， 表达 式 fruit[-2] 返回 倒数 
第 二 个 字母 ， 依 此 类 推 。 


8.3 ”使 用 for 循环 进行 遍历 


有 很 多 计算 都 涉及 对 字符 串 每 次 处 理 一 个 字符 的 操作 。 它 们 常常 
从 开头 起 ， 每 次 选择 一 个 字符 ， 对 它 做 一 些 处 理 ， 再 继续 ， 直 到 结 
束 。 这 种 处 理 的 模式 ， 我 们 称 为 遍历 ”(traversal) 。 编 写 遍 历 逻 辑 的 方 
法 之 一 是 使 用 while 循环 : 
index = 0 


while index < len(fruit): 
letter = fruit[index] 


print(letter) 
index = index + 1 


这 个 循环 遍历 字符 串 ， 并 将 每 个 字符 显示 在 单独 的 一 行 上 。 循 环 
的 结束 条 件 是 jndex < len(fruit) ， 所 以 当 index 等 于 字符 串 的 
长 度 时 ， 条 件 为 假 ， 循 环 体 不 被 运行 。 最 后 访问 的 字符 下 标 为 
len(fruit)-1， 正 好 是 字符 串 最 后 一 个 字符 。 


作为 练习 ， 写 一 个 钞 数 ， 接 收 一 个 字符 串 作为 形 参 ， 并 倒序 显示 
1 


写 肖 历 逻 辑 的 男 一 个 方式 是 使 用 for 循环 : 


for letter in fruit: 
print(letter) 


每 次 迭代 之 中 ， 了 字符 串 中 的 下 一 个 字符 会 被 赋值 给 变量 letter 。 
循环 会 继续 直到 没有 剩余 的 字符 为 止 。 


下 面 的 示例 展示 了 如 何 利用 字符 串 拼 接 (字符 串 加 法 ) 和 一 个 for 
循环 来 生成 字母 序列 (也 就 是 ， 按 字母 顺序 排序 的 序列 ) 。 在 Robert 
McCloskey 的 书 《 为 小 鸭 让 路 》 (Make Way for Ducklings ) 中 ， 小 鸭 们 
的 名 字 是 Jack、Kack、Lack、Mack、Nack、Ouack、Pack 及 Quack。 下 
面 的 循环 按 顺 序 输出 这 些 名 字 : 


prefixes = 'JKLMNOPQ' 
suffix = "ack' 


for letter in prefixes.: 
print(letter + suffix) 


输出 是 : 


当然 那 并 不 完全 正确 ， 因 为 “Ouack” 和 “Quack” 拼 写 错 了 。 作 为 练 
习 ， 修 改 程序 解决 这 个 问题 。 


8.4 字符 串 切 片 


字符 串 中 的 一 段 称 为 一 个 切片 (slice) 。 选 择 一 个 切片 和 选择 一 
个 字符 类 似 : 


>>> s = 'Monty Python' 


操作 符 [n:m] 返回 字符 串 从 第 n 个 字符 到 第 m 个 字符 的 部 分 ， 包 
含 第 n 个 字符 ， 但 不 包含 第 m 个 字符 。 这 个 行为 有 些 违反 直觉 ， 但 如 果 
想象 下 标 是 指 同 字符 之 间 的 位 置 ， 可 以 帮助 我 们 理解 它 ， 如 图 8-1 所 
A? 


ndex 0 1 2 3 4 5 6 


图 8-1 切片 的 下 标 


如 果 省 略 掉 第 一 个 下 标 (冒号 之 前 的 那个 ， 切 片 会 从 字符 串 开 
头 开 始 。 如 采 省 略 挥 第 二 个 下 标 ， 切 片 会 继续 到 字符 串 的 结尾 。 


>>> fruit = 'banana' 


如 果 第 一 个 下 标 大 于 或 等 于 第 二 个 下 标 ， 结 果 是 空 字 符 串 ， 用 两 
个 了 | 村 表 呈 | 


>>> fruit = 'banana' 
>>> fruit[3:3] 
ri 


空 字符 串 不 包含 任何 字符 ， 长 度 为 0， 但 除 此 之 外 ， 它 和 其 他 字符 


继续 本 例 ， 你 认为 fruit[ : ] 表示 什么 ? 壬 试 一 下 看 看 结果 。 


8.5 “字符 串 是 不 可 变 的 


想 要 修改 子 符 串 的 某 个 字符 ， 你 可 能 会 想 直 接 在 赋值 左 侧 使 用 [] 
操作 符 。 例 如 : 


>>> greeting = 'Hello, world!' 
>>> greeting[0] = 'J' 


TypeError: 'str' object does not support item assignment 


这 个 例子 里 的 “对 象 ”(object) 是 字符 串 ， 而 “项 ”(item) 是 指 你 
想 要 赋值 的 那个 字符 。 就 现在 来 说 ， 一 个 对 象 和 值 是 差不多 的 东西 ， 
但 我 们 会 在 后 面 细 谈 它 (参见 10.10 入 ) 。 


这 个 错误 产生 的 原因 是 因为 字符 串 是 不 可 变 (immutable) 的 ， 也 
就 是 说 ， 不 能 修改 一 个 已 经 存在 的 字符 串 。 你 能 做 的 最 多 古 新 建 一 个 
字符 串 ， 它 和 原来 的 字符 串 稍 有 不 同 : 


>>> greeting = 'Hello, world!' 
>>> new_greeting = 'J' + greeting[1:] 
>>> new_greeting 


'Jello, world!' 


这 个 例子 使 用 新 的 首 字符 和 greeting 的 一 个 切片 拼接 起 来 。 它 
对 原来 的 字符 串 没有 影响 。 


8.6 ”搜索 


下 面 的 这 段 钞 数 古 做 什么 的 ? 


def find(word, letter): 
index = 0 
while index < len(word): 
if word[index] == letter: 
return index 


jndex = Index + 1 
return - 1 


从 某 种 意义 上 说 ，find 是 [] 操作 符 的 反面 。 和 [] 操作 符 通过 一 
个 下 标 查 找 对 应 的 字符 不 同 ， 它 根据 一 个 字符 查找 其 出 现在 字符 串 中 
的 下 标 。 如 果 没 有 找到 字符 ， 画 数 返 回 -1 。 


这 是 我 们 第 一 次 在 循环 内 部 看 到 return 语句 。 如 采 
word[index] == letter ， 画 数 直 接 跳出 循环 并 立即 返回 。 


如 有 果 字 符 没 有 出 现在 字符 串 中 ， 程 序 正 常 退出 循环 ， 并 返回 -1。 


这 种 计算 的 模式 一 一 遍历 一 个 序列 ， 并 当 找 到 我 们 寻找 的 目标 时 


返回 一 一 称 为 搜索 。 


作为 练习 ， 修 改 find 函数 ， 让 它 接收 第 3 个 形 参 ， 表 示 从 word 的 
哪个 下 标 开始 搜索 。 


8.7 ”循环 和 计数 


下 面 的 代码 计算 字母 a 在 字符 串 中 出 现 的 次 数 : 


word = 'banana' 
count = 0 
for letter in word: 
if letter == 'a': 
count = count + 1 


print(count) 


这 个 程序 展示 了 男 一 种 计算 模式 ， 称 为 计数 器 。 变 量 count 初始 
化 为 0， 接 着 每 次 找到 一 个 a 时 计数 器 加 1。 当 循环 结束 时 ，count 保 
存 痢 结 a 出 现 的 总 次 数 。 


作为 练习 ， 将 这 段 代 码 封装 成 男 数 count ， 并 泛 化 它 以 接收 字符 
串 和 要 计数 的 字母 作为 形 参 。 

接着 重 写 count 函数 ， 不 直接 遍历 字符 串 ， 而 是 使 用 前 面 一 节 中 
的 3 形 参 版 本 的 find 函数 。 


8.8 ”字符 串 方 法 


字符 串 提供 了 很 多 完成 各 种 操作 的 有 用 的 方法 。 方 法 和 函数 很 相 
似 一 一 它 接收 形 参 并 返回 值 一 一 但 语法 有 所 不 同 。 例 如 ， 方 法 upper 
接收 一 个 字符 串 ， 并 返回 一 个 全 部 字母 部 十 大 写 的 字符 串 。 


和 画 数 的 语法 upper(word) 不 同 ， 它 使 用 方法 的 调用 语法 
word ,Upper() 。 


>>> word = 'banana' 
>>> new_word = word.upper() 
>>> new_word 


' BANANA 


这 种 句点 表示 法 指定 了 方法 的 名 称 ， 以 及 方法 应 用 到 的 字符 串 的 
名 称 word。 空 的 括号 表示 这 个 方法 没有 任何 参数 。 


方法 的 调用 称 为 invocation 由 ;在 这 个 例子 里 ， 我 们 说 我 们 在 
word 字符 串 上 调用 方法 upper 。 


实际 上 ， 字 符 串 本 来 殉 有 一 个 方法 find ， 和 我 们 之 前 写 的 find 
函数 非 钊 相似 : 


>>> word = 'banana' 
>>> index = word.find('a') 
>>> index 


1 


在 这 个 例子 中 ， 我 们 在 word 上 调用 find 方法 ， 并 传 入 要 查找 的 
字母 作为 实 参 。 


实际 上 ，find 方法 比 我 们 的 函数 更 通用 ; 它 可 以 用 来 查找 子 字符 
串 ， 而 不 仅仅 生字 符 : 


>>> word.find('na') 
2 


上 默认 情况 下 ，find 在 字符 串 的 开始 局 动 ， 但 它 还 可 以 接收 第 二 个 
实 参 ,表示 从 哪 一 个 下 标 开始 查找 : 


>>> word.find('na', 3) 
4 


这 是 可 选 参数 的 一 个 示例 。find 还 可 以 接收 第 三 个 实 参 ， 表 示 查 
找到 哪个 下 标 束 结束 : 


>>> name = 'bob' 
>>> name.find('b', 1, 2) 


- 汗 

这 个 搜索 失败 ， 因 为 b 并 没有 在 字符 串 的 下 标 1 到 2 之 间 (不 包括 
2) 出 现 。find 在 搜索 时 只 搜索 到 第 二 个 (但 不 包括 第 二 个 ) 下 标 为 
止 ， 这 使 find 和 切片 操作 符 的 行为 一 致 。 


8.9 ”操作 符 in 


in 是 一 个 布尔 操作 符 ， 操 作 于 两 个 字符 串 上 ， 如 果 第 一 个 是 第 二 
个 的 子 串 ， 则 返回 True ， 否 则 返回 False : 


>>> 'a' in 'banana' 
True 


>>> 'seed' lin 'banana' 
False 


例如 ， 下 面 的 函数 打印 出 word1 中 出 现 且 出 现在 word2 中 的 所 有 
字 村 : 
def in_both(word1i, word2): 


for letter in word1: 
if letter In word2: 


print(letter) 


精心 选择 变量 名 称 后 ，Python 有 时 会 读 起 来 很 像 英 语 。 可 以 这 样 读 
这 个 循环 : “for (each) letter in (the first) word, if (the) letter (appears) in 
(the second) word, print (the) letter” ° 


下 面 是 用 这 个 函数 比较 单词 apples 和 oranges 的 结果 : 


>>> in_both('apples', 'oranges') 


8.10 “字符 串 比 较 


关系 操 作 符 也 可 以 用 在 字符 串 上 。 检 查 两 个 字符 串 是 否 相 等 : 


If word == 'banana': 
print('All right, bananas.') 


其 他 的 关系 操作 符 在 将 单词 按照 字母 顺序 比较 时 有 用 : 


if word < 'banana': 

print('Your word,' + word + ', comes before banana.') 
elif word > 'banana': 

print('Your word,' + word + ', comes after banana.') 


else: 
print('All right, bananas.') 


Python 处 理 大 小 写字 母 时 和 人 处 理 时 不 一 样 。 所 有 的 大 写字 母 都 在 
小 写字 母 之 前 。 所 以 : 


Your word, Pineapple, comes before banana. 


处 理 这 个 问题 的 常用 办 法 是 先 将 字符 串 都 转换 为 标准 的 形式 ， 如 
都 转换 成 全 小 写字 母 形 式 ， 再 进行 比较 。 如 果 你 壳 到 一 个 武 泌 着 
Pineapple 的 敌人 需要 保护 自己 时 ， 请 记 住 这 个 办 法 。 


8.11 调试 


当 使 用 下 标 来 遍历 序列 中 的 值 时 ， 要 正确 实现 遍历 的 开端 和 结尾 
并 不 容易 。 I 能 够 比较 两 个 单词 ， 如 果 它 们 互 为 倒 
序 ， 则 返回 True ， 但 这 个 函数 包含 了 两 个 错误 : 


def is_reverse(word1, word2): 
if len(word1) != len(word2): 
return False 


i=0 
] = len(word2) 


while j > 0: 
If word1[I] != word2[j]: 
return False 
jj 
j 


return 


一 个 if 语句 检查 两 个 单词 是 否 长 度 相同 。 如 果 不 同 ， 我 们 就 立 
即 返 回 False ， 人 否则 在 后 面 整个 画 效 中 ， 都 可 以 认为 两 个 单词 是 相同 
长 度 的。 这 是 6.8 节 中 讲 到 的 守卫 模式 的 一 个 实例 。 


i 和 j 是 下 标 : i 用 于 正 向 遍历 word1 ， 而 j 用 于 反 向 遍历 word2 
。 如果 我 们 找到 两 个 不 匹配 的 字母 ， 则 可 以 立即 返回 False 。 如 果 完 
成 整个 循环 后 所 有 的 字母 仍然 都 相等 ， 则 返回 True 。 


如 果 使 用 单词 “pots” 和 “stop” 来 测试 这 个 函数 ， 我 们 会 预期 返回 值 
是 True ， 但 实际 上 会 得 到 一 个 IndexError: 


>>> is_reverse('pots', 'stop') 


File "reverse.py", line 15, in is_reverse 


If word1[I] != word2[j]: 
IndexError: string index out of range 


为 了 调试 这 类 错误 ， 第 一 步 可 以 在 发 生 镑 误 的 那 行 代码 之 前 打印 
出 索引 的 值 。 


while j > 0: 
print 二 ，j # 在 这 里 打印 


if word1[I] != word2[j]: 
False 

i 

j 


这 样 再 一 次 运行 程序 时 ， 能 获得 更 多 的 信息 : 


>>> is_reverse('pots', 'stop') 
0 4 


IndexError: string index out of range 


第 一 次 迭代 时 ，j 的 值 是 4， 超 出 了 'pots ' 的 范围 。 最 后 一 个 字 
符 的 下 标 是 3， 所 以 j 的 初始 值 应 该 是 len(word2)-1。 


如 采 修 改 这 个 错误 并 重新 运行 程序 ， 会 得 到 |: 


>>> is_reverse('pots', 'stop') 


这 回 我 们 得 到 了 正确 的 结果 ， 但 看 起 来 循环 只 运行 了 3 次 ， 有 些 可 
疑 。 为 了 对 具体 发 生 了 什么 有 更 清晰 的 印象 ， 可 以 画 一 个 状态 图 。 第 
一 个 迭代 中 ，is_reverse 的 帧 显示 在 图 8-2 中 。 


word1 —= ‘pots Word2 一 > Stop- 


[一 > 0 j 一 > 3 


图 8-2 ”状态 图 


我 特意 安排 了 帧 中 变量 的 位 置 ， 并 使 用 虚线 来 显示 i 和 j 指向 
word1 和 word2 中 的 字符 。 


从 这 个 图 开始 ， 在 纸 上 运 行程 序 ， 每 个 和 迭 代 修 改 和 j 的 值 。 找 到 
并 修复 这 个 函数 的 第 二 个 错误 。 


8.12 术语 表 


对 象 (object) : 变量 可 以 引用 的 一 种 事物 。 就 现在 来 说 ， 可 以 
把 “对 象 ” 当 作 “ 值 ”来 使 用 。 


序列 (sequence) : 一 个 有 序 的 值 的 集合 ， 其 中 每 个 使 用 一 个 下 
标 来 定位 。 


项 (item) : 序列 中 的 一 个 值 。 


下 标 (index) : 用 于 在 序列 中 选择 元 素 的 整数 值 。 例 如 ， 可 以 用 
于 在 字符 串 中 选取 字符 。 在 Python 中 下 标 从 0 开始 。 


切片 (slice) : 字符 串 的 一 部 分 ， 通 过 一 个 下 标 范 围 来 定位 。 


JS 


空 字符 串 (empty string) : 没有 字符 ， 长 度 为 0 的 字符 串 ， 使 用 一 
对 引号 来 表示 。 


不 可 变 (immutable) : 序列 的 一 种 属性 ， 表 示 它 的 元 素 是 不 可 以 
改变 的 。 


授 历 ” (traverse) : 送 代 访 问 序列 中 的 每 一 个 元 素 ， 并 对 每 个 元 素 
进行 相似 的 操作 。 


搜索 (search) : 一 种 遍历 的 模式 ， 当 找到 它 想 要 的 元 素 时 停止 。 


计数 器 ”(counter) : 一 种 用 来 计数 的 变量 ， 通 常 初始 化 为 0， 后 来 


会 递增 。 

方法 调用 (invocation) : 调用 一 个 方法 的 语句 。 

可 选 参数 (optional argument) : 函数 或 方法 中 ， 并 不 必须 有 的 参 
8.13 ”练习 


练习 8-1 


在 http://docs.python.org/3/Vlibrary/stdtypes.htmjl#string-methods 阅 读 字 
符 串 方法 的 文档 。 你 可 能 会 想 实 验 一 下 其 中 的 一 些 方法 ， 以 确保 目 己 
理解 了 它们 的 工作 方式 。 strip 和 replace 特别 有 用 。 


文档 中 使 用 了 一 种 可 能 会 引起 困惑 的 语法 。 例 如 ，find(sub[， 
start[，end]] ) 中 的 方 括号 表示 可 选 的 参数 。 所 以 sub 是 必需 的 ， 
但 是 start 是 可 选 的 ， 并 且 如 果 使 用 了 start ， 则 end 是 可 选 的 。 


AM :8-2 


有 一 个 字符 串 方 法 叫 作 count ， 和 我 们 之 前 在 8.9 市 中 展示 的 方法 
类 似 。 阅 读 这 个 方法 的 文档 ， 并 写 一 个 程序 调用 它 来 计算 'banana 
中 a 出 现 的 次 数 。 


hoa :8-3 


字符 串 切 片 可 以 接受 第 三 个 下 标 用 来 指定 “ 步 长 "”， 即 相 邻 的 字符 
之 间 的 距离 。 步 长 为 >， 意思 是 切片 每 次 取 接 下 来 第 2 个 字符 ， 步 长 3 意 
思 是 每 次 取 接 下 来 第 3 个 字符 ， 等 等 。 


>>> fruit = 'banana' 
>>> fruit[0:5:2] 


'bnn' 


步 长 为 -1 表示 切片 按照 相反 的 方 同 访问 字符 串 ， 所 以 切片 [: : -14] 
会 得 到 一 个 逆序 的 字符 串 。 


使 用 这 个 特性 来 编写 一 个 一 行 版 本 的 is_palindrome 函数 ( 见 
练习 6-3) 


练习 8-4 


下 面 的 几 个 函数 目的 都 是 检查 一 个 字符 串 是 否 包 侣 小 写字 母 ， 但 
至 少 有 一 个 是 错误 的 。 对 每 个 函数 ， 摘 述 一 下 这 个 函数 到 抬 做 了 什么 
(假设 形 参 是 一 个 字符 串 ) 。 


def any_lowercase1(s): 
for c in s: 
If c.islower(): 
return True 
else: 
return False 


def any_lowercase2(s): 
for c in s: 
if 'c'.islower(): 
return 'True' 
else: 
return 'False' 


def any_lowercase3(s): 
for c in s: 
flag = c.islower() 
return flag 


any_lowercase4(s): 
flag = False 
for c in s: 
flag = flag or c.islower() 
return flag 


def any_lowercase5(s): 
for c in s: 
If not c.islower(): 
return False 
return True 


练习 8-5 


凯撒 密码 (Caesar Cypher) 是 一 个 比较 弱 的 加 密 形 式 ， 它 涉及 将 
单词 中 的 每 个 字母 “轮转 ”固定 数量 的 位 置 。 轮 转 一 个 字母 意思 是 在 字 
母 表 中 移动 它 ， 如 果 需 要 ， 再 从 开头 开始 。 所 以 ' 信 轮转 3 个 位 置 
征 'D'， 而 'Z 轮 转 一 个 位 置 是 "A'。 


要 对 一 个 单词 进行 轮转 操作 ， 对 其 中 每 一 个 字母 进行 轮转 即 可 。 
例如 , “cheer” 轮 转 7 位 的 结果 是 “jolly”"， 而 “melon” 轮 转 -10 位 结果 
是 “cubed”。 在 电影 《2001 太 至 漫游 》 中 ， 舰 载 机 楼 人 叫 作 HAL， 这 个 
单词 正 是 IBM 轮 转 -1 位 的 结 采 。 


编写 一 个 芳 数 rotate_word ， 接 收 一 个 字符 绅 以 及 一 个 整数 作为 
参数 ， 并 返回 一 个 新 字符 串 ， 其 中 的 字母 按照 给 定 的 整数 值 “轮转 ”位 


乌 


你 可 以 使 用 内 置 函 数 ord ， 它 能 够 将 一 个 字符 转换 为 数值 编码 ， 
以 及 函数 chr ， 它 将 数值 编码 转换 为 字符 。 子 母 表 中 的 子 母 是 按照 子 
母 顺 序 编码 的 ， 所 以 ， 例 如 : 


>>> ord('c') - ord('a') 
2 


因为 'c' 在 字母 表 中 的 下 标 是 2。 但 是 请 注意 ;大写 字母 的 数字 编 
码 是 不 同 的 。 


因特网 上 有 些 可 能 冒犯 人 的 笑话 是 用 ROT13 编 码 的 。ROT13 是 轮 
转 13 位 的 凯撒 密码 。 如 果 你 不 容易 被 冒犯 ， 可 以 寻找 一 些 并 解码 。 


解答 : http:/thinkpython2.comy/code/rotate.py。 


[1] 普通 画 数 的 调用 ， 称 为 call 。 一 一 译 者 注 


第 9 章 ”案例 分 析 : 文字 游戏 


本 章 介绍 第 二 个 案例 分 析 ， 讲 述 的 是 通过 搜索 具有 某 种 特性 的 单 
词 来 解决 单词 谈 题 这 一 话题 。 例 如 ， 我 们 会 寻找 英语 单词 中 最 长 的 回 
文 单词 ， 还 会 搜索 那些 其 字母 按照 字母 表 顺 序 排列 的 单词 。 另 外 ， 我 
会 介绍 男 一 种 程序 开发 计划 :缩减 问题 规模 ， 回 归 成 之 前 解决 过 的 问 


题 。 


9.1 读 取 单词 列表 


为 本 章 的 练习 ， 我 们 需要 准备 一 个 英文 单词 列表 。 互 联网 上 有 很 
多 可 用 的 单词 列表 ， 但 最 适合 我 们 的 目标 的 单词 列表 ， 是 由 Grady 
Ward 收 集 整 理 并 作为 Moby 词 典 项 目 (参看 
http://wikipedia.org/wiki/Moby_Project) 的 一 部 分 贡献 给 公共 域 的 。 它 
包含 113 809 个 正式 的 填 字 游戏 用 词 ， 即 那些 认为 可 以 用 于 纵横 填 字 游 
戏 和 其 他 类 型 文字 游戏 的 单词 。 在 Moby 集 合 中 ， 文 件 名 是 
113809of .fic ; 可 以 从 http://thinkpython.com/code/words. txt 下 载 一 
个 副本 ， 但 文件 名 是 更 简单 的 words ,txt 。 


这 个 文件 是 纯 文 本 ， 所 以 可 以 使 用 文本 编辑 器 打开 ， 也 可 以 使 用 
Python 读 入 它 。 内 置 画 数 open 接收 文件 名 作为 参数 ， 并 返回 一 个 文件 
对 象 ” (file object) ， 可 以 用 来 读 取 文件 。 


>>> fin = open('words.txt') 


fin 十 用 来 表示 文件 对 象 作为 输入 源 时 第 用 的 名 称 。 文 件 对 象 提 
供 了 几 个 方法 用 于 读 取 内 容 ， 包 括 readline ， 它 会 从 文件 里 恋 入 字 
符 ， 直 到 获得 换行 符 为 止 ， 并 将 读 入 的 结 末 作为 一 个 字符 串 返回 : 


>>> fin.readline() 
'aaNrxNn' 


在 这 个 特定 的 列表 中 ， 第 一 个 单词 是 "aa"， 它 是 一 种 火山 熔岩 。 
序列 \r\n 表示 两 个 空格 字符 ， 一 个 是 回 车 ， 一 个 是 换行 ， 用 于 把 这 
个 单词 和 其 他 单词 分 隔 开 。 


文件 对 象 会 记录 它 读 到 文件 的 哪个 位 置 ， 因 此 如 果 再 次 调用 


readline ， 会 得 到 下 一 个 单词 : 


>>> fin.readline() 
"aahxrxNn' 


下 一 个 单词 是 "aah"， 也 是 一 个 完全 合法 的 单词 ， 所 以 别 用 奇怪 的 
眼光 看 着 我 。 或 者 ， 如 果 是 那 几 个 空白 字符 在 干扰 你 ， 可 以 使 用 字符 
串 的 方法 strip 去 掉 它 们 : 


>>> line = fin.readline() 
>>> word = line.strip() 
>>> word 


'aahed' 


你 也 可 以 在 for 循环 中 使 用 文件 对 象 。 下 面 的 代码 读 入 
words .txt 并 每 行 打印 出 一 个 单词 : 


fin = open('words.txt') 
for line in fin: 


word = line.strip() 


print(word) 


9.2 Hod 习 


在 下 一 节 里 有 这 些 练习 的 解答 。 在 继续 阅读 解答 之 前 ， 应 当 至 少 
尝试 一 下 每 一 个 练习 。 


练习 9-1 


编写 一 个 程序 ， 读 入 words .txt 并 且 打 印 出 那些 长 度 超过 20 个 
字符 的 单词 (不 算 空白 字符 ) 


[© 


练习 9-2 


1939 年 ，Ernest Vincent Wright 出 版 了 一 本 5 万 字 的 小 说 Gadsby ， 
这 本 书 里 没有 包含 字母 “e”。 因 为 “e” 是 英语 中 最 常见 的 字母 ， 所 以 这 
并 不 是 件 容 易 的 事 。 


实际 上 ， 不 使 用 这 最 常见 的 字母 的 话 ， 仅 仅 是 构建 一 条 单独 的 构 


思 也 年 很 难 的 事情 。 开 始 时 会 很 慢 很 艰难 ， 但 保持 谨慎 和 长 时 间 的 训 
练 ， 你 可 以 渐渐 掌握 方法 。 


好 吧 ， 我 先 停 下 来 。 站 


写 一 个 函数 has_no_e ， 当 给 定 的 单词 不 包含 字母 “e" 时 ， 返 回 
True。 


修改 前 一 市 练习 中 的 代码 ， 打 印 出 不 含 “e” 的 单词 ， 并 计算 这 种 单 
词 在 整个 单词 表 中 的 百分比 。 


练习 9-3 


编写 一 个 函数 avoids ， 接 收 一 个 单词 ， 以 及 一 个 包含 禁止 字母 
的 字符 串 ， 当 单词 不 含 任 何 茜 止 字母 时 ， 返 回 True。 


修改 你 的 程序 ， 提 示 用 户 输入 包含 休止 字母 的 字符 串 ， 并 打印 出 
不 包含 任意 禁止 字母 的 单词 的 个 数 。 能 不 能 找到 一 组 5 个 全 止 字 母 的 组 
会 ， 它 们 排除 的 单词 最 少 ? 


n> 


练习 9-4 
编写 一 个 名 为 uses_only 的 函数 ， 接 收 一 个 单词 以 及 字母 组 成 


的 字符 串 ， 当 单词 只 由 这 些 字 母 组 成 时 返回 True 。 你 可 以 造 一 个 句 
子 ， 其 单词 只 由 字母 acefh1o 组 成 吗 ? 除了 “Hoe alfalfa” 之 外 呢 ? 


练习 9-5 


编写 一 个 名 为 uses_all 的 范 数 ， 接 收 一 个 单词 以 及 由 需要 的 字 
母 组 成 的 字符 串 ， 当 单词 中 所 有 需要 的 字母 都 出 现 了 至 少 一 次 时 返回 
True 。 有 多 少 单 词 使 用 了 所 有 的 元 首 字 母 aeiou ? 而 aeiouy 呢 ? 


od ‘29-6 


编写 一 个 名 叫 is_abecedarian 的 函数 ， 如 果 单 词 中 的 字母 是 
按照 字母 表 顺 序 排列 的 (两 个 重复 字母 也 可 以 ) ， 则 返回 True 。 有 


多 少 这 样 的 单词 ? 
9.3 ”搜索 


前 面 一 广 的 所 有 练习 都 有 一 个 共同 点 ， 它 们 可 以 使 用 我 们 在 8.6 市 
中 介绍 的 搜索 模式 来 解决 。 最 简单 的 例子 是 : 
def has_no_e(word): 


for letter in word: 
if letter == 'e': 


return False 
return True 


for 循环 裔 历 单词 word 中 的 字符 。 如 有 果 我 们 找到 字母 <e"， 可 以 
立即 返回 False ; 否则 只 能 继续 下 一 个 字母 。 如 采 正 滑 退 出 了 循环 ， 
则 说 明 我 们 没有 找到 “e”， 所 以 返回 True 。 


使 用 in 操作 符 ， 可 以 把 这 个 函数 写 得 更 倘 活 。 上 面 这 个 示例 没有 
写 得 更 简 话 和 是 因为 想 要 展现 搜索 模式 的 逻辑 。 


avoids 是 has_no_e 的 更 通用 的 版 本 ， 它 们 的 结构 相同 : 


def avoids(word, forbidden): 
for letter in word: 
if letter in forbidden: 


return False 
return True 


一 旦 发 现 一 个 禁止 的 字母 ， 可 以 立即 返回 False ; 如 果 运 行 到 循 
环 结束 ， 则 返回 True 。 


uses_only 画 数 也 类 似 ， 只 是 它 条 件 判 断 的 意思 是 相反 的 ; 


def uses_only(word, available): 
for letter in word: 


if letter not in available: 
return False 
return True 


它 接 收 的 参数 并 不 是 一 个 禁止 字母 列表 ， 而 是 一 个 可 用 字母 列表 
available 。 如 果 我 们 发 现 单词 中 遇 到 了 并 不 属于 available 的 字 
母 ， 则 可 以 返回 False 。 


uses_all 函数 也 类 似 ， 但 单词 和 字母 列表 的 角色 相反 。 


def uses_all(word，redquired ) : 
for letter in required: 


if letter not in word: 
return False 
return True 


我 们 不 再 遍历 单词 word 中 的 字母 ， 而 是 循环 明 历 必需 的 单词 列 
表 required 。 如 果 单 词 列表 中 有 任意 字母 没有 出 现在 单词 中 ， 我 们 
可 以 返回 False。 


如 果 你 真 的 像 计算 机 科学 家 那样 思考 的 话 ， 应 该 已 经 发 现 ， 
uses_all 实际 上 是 已 经 解决 的 问题 的 一 个 特例 ， 并 且 可 以 这 么 写 : 


def uses_all(word，redquired ) : 
return uses_only(required, word) 


这 是 被 称 为 将 问题 回归 到 已 解决 问题 (reduction to a previously 
solved problem) 的 程序 开发 计划 的 一 个 例子 。 意 即 你 需要 识别 出 的 当 
前 问题 是 一 个 已 经 解决 的 问题 的 特例 ， 从 而 可 以 直接 利用 现 有 的 解决 


方案 。 


9.4 ”使 用 下 标 循环 


在 前 面 一 节 的 例子 中 ， 我 使 用 for 循环 进行 裔 历 ， 因 为 只 需要 字 
符 串 中 的 字符 ， 而 不 需要 操作 下 标 。 


但 对 is_abecedarian 函数 我 们 需要 比较 相 邻 的 字母 ， 使 用 for 
循环 比较 困难 : 


def is_abecedarian(word): 
previous = word[0] 
for c in word: 
If c < previous: 


return False 
previous = C 
return True 


或 者 也 可 以 使 用 递归 : 


is_abecedarian(word): 

if len(word) <= 1: 
return True 

If word[0] > word[1]: 
return False 


return is_abecedarian(word[1:]) 


还 有 一 个 办 法 是 使 用 while 循环 : 


def is_abecedarian(word): 
i=0 
while i < len(word)-1: 


If word[i+1] < word[i]: 
return False 
i = i+1 
return True 


循环 开始 于 i=0， 并 结束 于 i=len (word)-1。 每 次 迭代 时 ， 比 
较 第 i 个 字符 (可 以 看 成 是 当前 字符 ;和 第 i +1 个 字符 (可 以 看 成 是 下 
一 个 字符 ) 。 


如 果 下 一 个 字符 比 当 前 字符 小 ( 即 按照 字母 顺序 在 前 ) ， 则 我 们 
发 现 了 一 个 破坏 字母 顺序 的 断 点 ， 可 以 返回 False 。 


如 果 我 们 没有 找到 任何 断 点 而 结束 循环 ， 则 这 个 单词 通过 了 测 
试 。 为 了 说 服 目 己 循环 是 正确 结束 的 ， 可 以 考虑 像 'f1ossy ' 这 样 的 
例子 。 这 个 单词 的 长 度 是 6， 所 以 最 后 一 次 循环 时 是 4， 即 旦 倒数 第 
二 个 字符 的 下 标 。 在 最 后 一 个 循环 中 ， 会 比较 倒数 第 二 个 和 最 后 一 个 
字符 ， 这 正 是 我 们 所 期 竺 的。 


下 面 是 is_palindrome 函数 (参考 练习 6-3) 的 一 个 版 本 ， 它 
使 用 两 个 下 标 ;， 一 个 从 0 开始 递增 ; 另 一 个 从 最 后 开始 递减 。 


def Is_palindrome(word ) : 
i=0 
] = len(word)-1 


while i<j: 
if word[i] != word[j]: 
return False 
i+1 
j-1 


i 
] 


return True 


或 者 ， 我 们 可 以 将 其 回归 到 已 经 解决 的 问题 ， 可 能 这 么 写 : 


使 用 练习 8-2 中 的 ijs_reverse 。 
9.5 ”调试 
测试 程序 很 难 。 本 章 中 的 函数 相对 容易 测试 ， 因 为 可 以 简单 地 手 


动 验 证 结果 。 即 便 如 此 ， 要 选择 一 组 可 以 测试 到 所 有 可 能 的 错误 的 单 
词 ， 也 是 很 困难 的 ， 甚 至 是 不 可 能 的 。 


举 has_no_e 作为 例子 ， 有 两 个 很 明显 的 用 例 可 以 检测 : 包 
含 “e” 的 单词 应 该 返回 False ; 不 包含 “e” 的 应 当 返 回 True 。 为 这 两 
种 情况 找到 具体 的 单词 没有 问题 。 


但 对 每 种 情况 来 说 ， 也 存在 一 些 不 那么 明显 的 具体 情况 。 在 所 有 
包含 “e” 的 单词 中 ， 你 应 当 测 试 以 “e”* 开 头 的 单词 ， 也 应 当 测 斌 以 “e” 结 
尾 ， 以 及 “e” 在 单词 中 部 的 情况 。 你 应 当 测 试 长 单词 、 短 单词 及 非常 短 
的 单词 ， 如 空 字符 串 。 空 字符 串 是 特殊 情形 (special case) 的 一 个 例 
子 。 特 殊 情 形 往 往 不 那么 明显 ， 但 又 常常 隐藏 着 错误 。 


除了 目 己 生成 的 测试 用 例 之 外 ， 还 可 以 使 用 类 似 words .txt 这 
样 的 单词 表 来 测试 你 的 程序 。 通 过 扫 摘 输出 ， 可 能 会 发 现 错误 ， 但 请 


注意 : 你 可 能 发 现 一 种 类 型 的 错误 (不 应 该 被 包含 但 却 被 包含 的 单 
词 ) ， 但 对 另 一 种 类 型 的 则 不 能 发 现 〈 应 该 被 包含 ， 但 却 没有 出 现 的 
单词 ) 。 


总 之 ， 测 试 可 以 帮助 你 发 现 pug， 但 生成 一 组 好 的 测试 用 例 并 不 容 
易 。 而 且 ， 即 使 有 好 的 测试 用 例 ， 也 无 法 确定 程序 是 完全 正确 的 。 引 
用 一 个 传奇 计算 机 科学 家 的 话 : 


程序 测试 可 以 用 来 显示 bug 的 存在 ， 但 无 法 显示 它们 的 缺席 ! 


(Program testing can be used to show the presence of bugs，but never to 


show their absence!) 


一 一 Edsger W.Dijkstra 


9.6 术语 表 


文件 对 象 ” (file object) : 用 来 表示 一 个 打开 的 文件 的 值 。 


将 问题 回归 到 已 解决 问题 (reduction to a previously solved 


problem) : 通过 把 问题 表述 为 已 经 解决 的 某 个 问题 的 特例 解决 问题 的 
一 种 方式 .* 


特殊 情形 ”(special case) : 一 种 不 典型 或 者 不 明显 (因此 更 可 能 
没有 正确 处 理 ) 的 测试 用 例 。 


9.7 ”练习 


练习 9-7 
本 练习 中 的 问题 是 基于 广播 节目 《车 迷 天 下 》 (Car Talk) 中 出 现 


的 一 个 谜 题 而 设计 的 ”(http:/www.cartalk.com/content/puzzlers ) : 


给 我 一 个 包含 3 组 连续 的 成 对 字母 的 单词 。 我 会 给 你 几 个 几乎 可 以 
达到 要 求 却 还 差 一 点 儿 的 词 作为 例子 。 例 如 ， 单 词 committee， 即 c-o- 
m-m-i-t-t-e-e。 除 了 i 不 满足 条 件 外 ， 这 个 单词 是 一 个 好 例子 。 或 者 
Mississippi: M-i-s-s-i- s-s-i-p-p-i。 如果 你 能 够 拿 挥 其 中 的 i， 则 它 也 符 
合 要 求 。 但 确实 有 这 么 一 个 单词 ， 并 且 就 我 所 知 ， 它 可 能 是 满足 这 个 
条 件 的 唯一 的 单词 。 当 然 也 可 能 存在 500 个 ， 但 我 只 能 想到 一 个 。 它 是 
什么 呢 ? 


编写 一 个 程序 来 找到 它 。 解 答 : 
http://thinkpython2.com/code/cartalk1l.py ° 


练习 9-8 
下 面 是 男 一 个 《车 迷 天 下 》 中 的 广 题 


(http://www.cartalk.com/content/puzzlers ) : 


“有 一 天 我 正在 高 速 公 路 上 开车 ， 磁 巧 注意 到 里 程 表 。 和 大 部 分 里 
程 表 一 样 ， 它 显示 6 位 整数 的 英里 数 。 所 以 ， 例 如 我 的 车 有 300 000 英 
里 里 程 ， 则 会 看 到 3-0-0-0-0-0。 


“那天 我 看 到 的 里 程 数 很 有 意思 。 我 发 现 最 后 4 位 数 是 回 文 的 ， 也 
就 是 说 ， 它 们 不 论 是 正 序 还 是 逆序 地 看 都 一 样 。 例 如 ，5-4-4-5 是 一 个 
回 文 ， 所 以 我 的 里 程 表 可 能 显示 为 3-1-5-4-4-5。 


“英里 之 后 ， 后 5 位 数组 成 一 个 回 文 。 例 如 ， 它 可 以 是 3-6-5-4-5- 
6。 再 过 1 英里 ，6 位 数 的 中 间 4 位 是 一 个 回 文 。 而 接 下 来 ， 你 准备 好 了 
吗 ? 又 1 英里 过 去 ， 所 有 的 6 位 数 都 成 了 回 文 ! 


“问题 是 ， 我 第 一 次 看 里 程 表 时 ， 它 的 示 数 是 多 少 ? ” 


编写 一 个 Python 程序 ， 检 测 全 部 的 6 位 数 ， 并 打印 出 可 以 满足 上 面 
这 些 要求 的 数字 。 解 答 : http:Wthinkpython2.comy/code/cartalk2.py。 


练习 9-9 


下 面 是 另 一 个 《车 迷 天 下 》 的 谜 题 ， 你 可 以 使 用 一 个 搜索 来 解决 


(http://www.cartalk.com/ content/puzzlers ) : 


“最 近 我 去 母亲 家 时 ， 我 发 现 目 己 的 年 龄 的 两 位 数 正 好 是 母亲 的 年 
挫 的 两 位 数 的 倒序 。 例 如 ， 如 有 果 她 是 73 多 ， 我 是 37 安 。 我 们 好 柯 这 种 
事情 这 些 年 来 发 生 过 几 次 ， 但 很 快 我 们 的 话题 吏 侦 转 到 其 他 地 方 ， 所 
以 没有 得 到 答案 。 

“我 回 家 后 ， 发 现 我 们 的 年 龄 互 为 倒序 的 事情 至 今 为 止 发 生 过 6 
次 。 我 还 发 现 ， 如 林 顺 利 的 话 接 下 来 儿 年 还 会 再 遇 到 一 次 ， 并 且 在 那 
之 后 如 果 我 们 真 的 很 辛 运 ， 还 能 再 直到 一 次 。 换 句 话 说 ， 它 总 共 可 能 
发 生 8 次 。 所 以 问题 是， 我 现在 年 龄 多 大 ? ” 

编写 一 个 Python 程序 ， 为 这 个 谜 题 搜 索 答 案 。 提 示 : 你 可 能 会 发 


现 字符 串 方 法 zfi11 有 用 。 


解答 : http://thinkpython2.com/code/cartalk3.py ° 


[1] 作者 在 上 一 段 话 中 模仿 了 Gadsby 的 风格 ， 不 使 用 字母 “e”， 上 所 以 说 
话 的 风格 很 怪 。 因 此 到 这 里 ， 他 就 说 “All right，T] stop now”， 意 思 是 
停止 这 种 怪异 风格 的 描述 。 但 这 个 意思 无 法 在 译文 中 表达 。 上 一 段 话 
的 英文 原文 是 : “In fact, it is difficult to construct a solitary thought 


without using that most common symbol. It is slow at first, but with caution 


and hours of training you can gradually gain facility. ”一 一 译 者 注 


第 10 章 ”列表 


本 章 介绍 Python 语言 最 有 用 的 内 置 类 型 之 一 : 列表。 你 还 能 学 到 更 
多 关于 对 象 的 知识 ， 以 及 同一 个 对 象 有 两 个 或 更 多 变量 时 会 发 生 什 
J 


10.1 列表 是 一 个 序列 


和 字符 串 相似 ， 列 表 (list) 是 值 的 序列 。 在 字符 串 中 ， 这 些 值 是 
字符 ; 在 列表 中 ， 它 可 以 是 任何 类 型 。 列 表 中 的 值 称 为 元 素 
element) ， 有 时 也 称 为 列表 项 (item) 。 


创建 一 个 列表 有 好 几 种 方式 。 其 中 最 简单 的 方式 是 使 用 方 括号 〈[ 
与 ] ) 将 元 素 括 起 来 。 


[10, 20, 30, 40] 
['crunchy frog', 'ram bladder', 'lark vomit'] 


第 一 个 例子 是 4 个 整数 的 列表 。 第 二 个 例子 是 3 个 字符 串 的 列表 。 
列表 中 的 元 素 并 不 一 定 非得 是 同一 类 型 的 。 下 面 的 列表 包含 了 一 个 字 
符 串 、 一 个 浮 点 数 、 一 个 整数 及 ( 瞧 ! ) 另 一 个 列表 : 


['spam', 2.0, 5, [10, 20]] 


列表 中 出 现 的 列表 是 航 套 的 (nested) 。 


不 包含 任何 元 素 的 列表 称 为 空 列表 ， 可 以 使 用 空 方 括号 [] 来 创建 
空 列表 。 


如 你 所 预料 的 ， 列 表 可 以 赋值 给 变量 : 


>>> cheeses ['Cheddar', 'Edam', 'Gouda'] 
>>> [42, 123] 
>>> empty = [] 


>>> print(cheeses, numbers, empty) 
['Cheddar', 'Edam', 'Gouda'] [42, 123] [] 


10.2 ”列表 是 可 变 的 


访问 列表 元 素 的 语法 和 访问 子 符 串 中 字符 的 语法 是 一 样 的 一 一 使 
用 方 括 号 操作 符 。 方 括号 中 的 表达 式 指定 下 标 。 请 记得 下 标 古 从 0 开始 
Ey: 


>>> cheeses[0] 
'Cheddar' 


和 字符 串 不 同 的 是 ， 列 表 是 可 变 的 。 当 方 括号 操作 符 出 现在 峰值 
语句 的 左 侧 时 ， 它 用 于 指定 列表 中 哪个 元 素 会 被 赋值 。 


>>> numbers = [42, 123] 
>>> numbers[1] = 5 
>>> numbers 


[42, 5] 


numbers 的 第 1 位 元 素 ， 原 先 的 值 是 123， 现 在 是 5 了 。 


图 10-1 显 示 了 cheeses 、numbers 和 empty 的 状态 图 。 


list 
cheeses 一 一 0 一 = Cheddar 
1 —= 'Edam' 


2 一 = Gouda 


numbers 一 


list 
empty 一 一 | 


图 10-1 状态 图 


在 图 10-1 中 ， 外 面 写 有 "list 的 图 框 表示 列表 ， 里 面 显示 的 是 列表 
中 的 元 素 。cheeses 变量 引用 着 一 个 列表 ， 包 含 3 个 元 素 ， 下 标 分 别 
是 0、1 和 2。numbers 包含 两 个 元 素 ; 本 图 显示 了 其 第 二 个 元 素 从 123 
重新 赋值 为 5 的 过 程 。empty 引用 一 个 没有 任何 元 素 的 空 列表 。 


列表 下 标 和 字符 串 下 标 工作 方式 相同 。 


。 任何 整 型 的 表达 式 都 可 以 用 作 下 标 。 
。 如 果 和 尝试 读 写 一 个 并 不 存在 的 元 素 ， 则 会 得 到 IndexError 。 
。 如果 下 标 是 负数 ， 则 从 列表 的 结尾 处 反 过 来 数 下 标 访问 。 


in 操作 符 也 可 以 用 于 列表 。 


>>> cheeses = ['Cheddar', 'Edam', 'Gouda'] 
>>> 'Edam' In cheeses 
True 


>>> 'Brie' in cheeses 
False 


10.3” 裔 历 一 个 列表 


遍历 一 个 列表 元 到 的 最 第 见方 式 古 使 用 for 循环 。 语 法 和 字符 串 
的 抽 历 相同 : 


for cheese in cheeses: 
print(cheese) 


在 只 需要 读 取 列表 的 元 素 本 吴 时 ， 这 样 的 志 历 方式 很 好 。 但 如 果 
需要 写 入 或 者 更 新 元 素 时 ， 则 需要 下 标 。 一 个 常见 的 方式 是 使 用 内 置 
函数 range 和 len : 


for i in range(len(numbers)): 
numbers[i] = numbers[i] * 2 


这 个 循环 遍历 列表 ， 并 更 新 每 个 元 素 。len 返回 列表 中 元 素 的 个 
数 。range 返回 一 个 下 标的 列表 ， 从 0 到 n -1， 其 中 n 是 列表 的 长 度 。 


每 次 大 代 时 ，1i 获得 下 一 个 元 素 的 下 标 。 循 环 体 中 的 赋值 语句 使 用 i 来 
取 元 素 的 旧 值 并 赋值 为 靳 值 。 


省 由 


在 空 列表 上 使 用 for 循环 ， 则 循环 体 从 不 会 被 运行 : 


for x in []: 
print('This never happens.') 


里 然 列 表 可 以 包含 其 他 的 列表 ， 网 倒 的 列表 仍然 被 看 作 一 个 单独 
的 元 素 。 下 面 的 列表 长 度 是 4: 


['spam', 1, ['Brie', 'Roquefort', 'Pol le Veq'], [1, 2, 3]] 


10.4 列表 操作 


+ 操作 和 从 可 以 拼接 列表 : 


= [1, 2, 3] 
= [4, 5, 6] 
=a+t+b 


第 一 个 例子 重复 列表 [9] 四 次 。 第 二 个 例子 重复 列表 [1，2，3] 


三 次 。 
10.5 ”列表 切片 


切片 操作 符 也 可 以 用 于 列表 : 


如 采 省 略 返 第 一 个 下 标 ， 则 切片 从 列表 开头 开始 。 如 采 省 略 挥 第 
二 个 下 标 ， 则 切片 至 列表 结尾 结束 。 如 果 两 个 下 标 都 省 略 ， 则 切片 束 
是 整个 列表 的 副本 。 


因为 列表 是 可 变 的 ， 所 以 在 对 列表 进行 修改 操作 之 前 ， 复 制 一 份 
征 很 有 用 的 。 


如 有 果 切 片 操作 符 出 现在 赋值 语句 的 左 侧 ， 则 可 以 更 新 多 个 元 素 : 


10.6 ”列表 方法 
Python 为 列表 提供 了 不 少 操作 方法 。 例 如 ，append 可 以 在 列表 尾 
部 添加 新 的 元 素 : 


>>> 七 二 Ia’ b ' ， "C 


>>> t.append('d') 
> 七 


extend 方法 接收 一 个 列表 作为 参数 ， 并 将 其 所 有 的 元 陛 附 加 到 列 
Ts 


>>> t1 二 ['a', 'b", 1 
>>> t2 二 ['d', 'e'] 
>>> ti1.extend(t2) 

>>> t1 

['a', 'b"; We 时 


这 个 例子 中 t2 没有 被 修改 。 


sort 方法 将 列表 中 的 元 素 从 低 到 高 重新 排列 : 


列表 的 大 多 数 方 法 全 是 无 返回 值 的 。 它 们 修改 列表 ， 并 返回 None 
。 如果 不 小 心 写 了 t = t,sort() ， 你 可 能 对 结果 感到 很 失望 。 


10.7 上 映射、 过 滤 和 化 简 


如 有 条 想 把 列表 中 所 有 的 元 系 加 起 来 ， 可 以 使 用 下 面 这 样 的 循环 : 


def add_all(t): 


total = 0 

for x in t: 
total += x 

return total 


total 被 初始 化 为 0。 每 次 循环 中 ，xX 获取 列表 中 的 一 个 元 素 。+= 
操作 符 为 更 新 变量 提供 了 一 个 简洁 的 方式 。 这 个 增加 赋值 语句 : 


CE 
total = total + x 


随 着 循环 的 运行 ，total 会 奈 积 列表 中 的 值 的 和 ; 这 样 使 用 一 个 
变量 有 时 称 为 累加 器 (accumulator) 。 


对 列表 元 聚 球 加 是 如 此 和 帝 见 的 操作 ， 以 至 于 Python 提供 了 一 个 内 置 
函数 s UM : 


>>> t = [1, 2, 3] 
>>> sum(t) 
6 


类 似 这 样 ， 将 一 个 序列 的 元 素 值 合 起 来 到 一 个 单独 的 变量 的 操 
作 ， 有 时 称 为 化 简 (reduce) 。 


有 时 候 你 想 要 在 让 历 一 个 列表 的 同时 构建 男 一 个 列表 。 例 如 ， 下 
面 的 芳 数 返 收 一 个 字符 串 列 表 ， 并 返回 一 个 新 列表 ， 其 元 素 古 大 写 的 
字符 串 : 


def capitalize all(t): 
res = [] 
for s in t: 


res.append(s.capitalize()) 
return res 


res 初始 化 为 一 个 空 列表 ， 每 次 循环 ， 我 们 给 它 附 加 一 个 元 素 。 
所 以 res 也 是 一 种 于 加 器 


像 capitalize_all 这 样 的 操作 ， 有 时 被 称 为 映射 (map) ， 
为 它 将 一 个 函数 (在 这 个 例子 里 是 capitalize 方法 ) “映射 ?到 一 个 
序列 的 每 个 元 素 上 。 


另 一 个 种 见 的 操作 和 是 选择 列表 中 的 某 些 元 素 ， 并 返回 一 个 子 列 
表 。 例 如 ， 下 面 的 函数 接收 一 个 字符 串 列表 ， 并 返回 那些 只 包公 大 写 
字母 的 字符 串 : 
def only_upper(t): 

res = [] 


for s in t: 
If s.isupper(): 


res.append(s) 
return res 


isupper 是 一 个 字符 串 方 法 ， 当 字符 串 中 只 包含 大 写字 母 时 返回 


True 。 


类 似 only_upper 这 样 的 操作 称 为 过 滤 (filter) ， 因 为 它 选择 列 
表 中 的 某 些 元 素 ， 并 过 滤 掉 其 他 的 元 素 。 


列表 的 绝 大 多 数 闻 用 操作 都 可 以 用 上 映射、 过滤 和 化 简 的 组 合 来 表 


达 。 


10.8 ”删除 元 素 


从 列表 中 删除 元 素 ， 有 多 种 方法 。 如 果 知 道 元 素 的 下 标 ， 可 以 使 
用 pop : 


pop 修改 列表 ， 并 返回 被 删除 挥 的 值 。 如 末 不 提供 下 标 ， 它 会 删 
除 并 返回 最 后 一 个 元 聚 。 


如 采 不 需要 使 用 删除 的 值 ， 可 以 使 用 del 操作 符 : 


如 琳 知 道 要 删除 的 元 素 〈 而 不 是 下 标 ) ， 则 可 以 使 用 remove : 


>>> 七 二 ['a', 'b", ic! 
>>> t.remove('b') 
>>> t 


['a', | 


remove 方法 的 返回 值 是 None 。 


大 要 删除 多 个 元 素 ， 可 以 使 用 del 和 切片 下 标 : 


和 通常 一 样 ， 切 厂 会 计 择 所 有 的 元 素 ， 直 到 第 二 个 下 标 (并 不 包 


10.9 ”列表 和 字符 串 


字符 串 是 字符 的 序列 ， 而 列表 是 值 的 序列 ， 但 字符 的 列表 和 字符 
串 并 不 相同 。 大 要 将 一 个 字符 捉 转 换 为 一 个 字符 的 列表 ， 可 以 使 用 函 
数 ]ist : 


由 于 1ist 是 内 置 钞 数 的 名 称 ， 所 以 应 当 尽量 避免 使 用 它 作 为 变量 


名 称 。 我 也 避免 使 用 L ， 因 为 它 看 起 来 太 像 数 子 1 了 。 因 而 我 使 用 t 。 


1ist 函数 会 将 字符 串 拆 成 单个 的 字母 。 如 有 果 想 要 将 字符 串 拆 成 单 
词 ， 可 以 使 用 split 方法 : 


"pining for the fjords' 
s.split() 


['pining', 'for', 'the', 'fjords'] 


split 还 接收 一 个 可 选 的 形 参 ， 称 为 分 隔 符 (delimiter) ， 用 于 
指定 用 哪个 字符 来 分 隔 单词 。 下 面 的 例子 中 使 用 连 字符 〈- ) 作为 分 隔 


>>> s = 'spam-spam-spam' 
>>> delimiter = '-' 

>>> t = s.split(delimiter) 
>>> t 

['spam', 'spam', "Spam '] 


join 十 split 的 敢 操 作 。 它 接收 字符 串 列 表 ， 并 拼接 每 个 元 
素 。join 是 字符 串 的 方法 ， 所 以 必须 在 分 隔 符 上 调用 它 ， 并 传 入 列表 
作为 实 参 : 
= ['pining', 'for', 'the', 'fjords'] 


>>> delimiter = " 
>>> s = delimiter.join(t) 


>>> s 
"pining for the fjords' 


在 这 个 例子 里 ， 分 阳 符 十 空格 ， 所 以 join 会 在 每 个 单词 之 间 放 一 
个 空格 。 奉 想 不 用 空格 直接 连接 字符 串 ， 可 以 使 用 空 字符 串 '' 作为 分 


10.10 ”对 象 和 值 


如 采 我 们 运行 下 面 的 赋值 语句 : 


a = 'banana' 
b = 'banana' 


我 们 知道 a 和 b 痢 是 一 个 字符 串 的 引用 。 但 我 们 不 知道 它们 是 否 指 
器 同一 个 字符 串 。 有 两 种 可 能 的 状态 ， 如 图 10-2 所 示 。 


a 一 = banana 和 
， banana 
b 一 = 'banana B= 


图 10-2 ”状态 图 


一 种 可 能 是 ，a 和 b 引用 着 不 同 的 对 象 ， 它 们 的 值 相同 。 男 一 种 情 
况 下 ， 它 们 指向 同一 个 对 象 。 


要 检查 两 个 变量 古 否 引用 同一 个 对 象 ， 可 以 使 用 is 操作 符 。 


>>> a = 'banana' 


所 以 状态 图 如 图 10-3 所 示 。 


a -一 > [1,2,3] 
b -一 > [1, 2,3] 


图 10-3 ”状态 图 


在 这 个 例子 里 我 们 会 说 这 两 个 列表 是 相等 的 (equivalent) ， 因 为 
它们 有 相同 的 元 素 ， 但 它们 不 是 相同 的 〈identical) ， 因 为 它们 并 不 是 
同一 个 对 象 。 如 采 两 个 对 象 相同 ， 则 必然 也 相等 ， 但 如 条 两 个 对 象 相 
等 ， 并 不 一 定 相 同 。 


到 目前 为 止 ， 我 们 都 不 加 区 分 地 使 用 对象" 和"* 值 >， 但 更 精确 的 说 
法 是 对 象 有 一 个 值 。 如 果 求 值 [1, 2, 3] ， 会 得 到 一 个 列表 对 象 ， 它 的 
值 是 一 个 整数 的 序列 。 如 果 另 一 个 列表 包含 相同 的 元 素 ， 我 们 说 它 有 
相同 的 值 ， 但 它们 不 是 同一 个 对 象 。 


10.11 别名 


如 果 a 引用 一 个 对 象 ， 而 你 赋值 b = a ， 则 两 个 变量 都 会 引用 同 


> 


这 里 的 状态 图 如 图 10-4 所 示 。 


和 


本 


图 10-4 ”状态 图 


变量 和 对 象 之 间 的 关联 关系 称 为 引用 (reference) 。 在 这 个 例子 
里 ， 有 两 个 指 回 同一 对 象 的 引用 。 


当 一 个 对 象 有 多 个 引用 ， 并 且 引 用 有 不 同 的 名 称 时 ， 我 们 说 这 
对 象 有 别名 (aliased) 。 


如 果 有 别名 的 对 象 是 可 变 的 ， 则 对 一 个 别名 的 修改 会 影响 另 一 


>>> b[0] = 42 
>>> a 
[42, 2, 3] 


虽然 这 种 行为 可 能 很 有 用， 但 它 也 容易 导致 错误 。 通 第 来 说 ， 当 
处 理 可 变 对 象 时 ， 避 人 免 使 用 别名 会 更 加 安全 。 


对 于 字符 串 这 样 的 不 可 变 对 象 ， 别 名 则 不 会 带 来 问题 。 在 下 面 的 
例子 中 ; 


a = 'banana' 
b = = 'banana' 


不 论 a 和 b 是 否 引 用 同一 个 字符 串 ， 痢 不 会 有 什么 区 别 。 


10.12 ”列表 参数 


当 你 将 一 个 列表 传递 给 函数 中 ， 函 数 会 得 到 列表 的 一 个 引用 。 如 
果 函 数 中 修改 了 列表 ， 则 调用 者 也 会 看 到 这 个 修改 。 例 如 ， 
delete_head 函数 删除 列表 中 的 第 一 个 元 素 : 


def delete_head(t) : 
del t[0] 


下 面 使 用 它 : 


>>> letters = ['a', 'b', 'c' 
>>> delete_ head(letters) 
>>> letters 


['b', "€"] 


参数 t 和 变量 letters 是 同一 个 对 象 的 别名 。 栈 图 如 图 10-5 所 


因为 列表 被 两 个 帧 共享 ， 所 以 我 将 它 画 在 中 间 。 


delete_head 


图 10-5 ” 栈 图 


区 分 修改 列表 的 操作 和 新 建 列表 的 操作 十 分 重要 。 例 如 ，append 
方法 修改 列表 ， 但 是 + 操作 符 新 建 一 个 列表 : 


>>> t1 = [1, 2] 
>>> t2 = t1.append(3) 


操作 符 + 创 建 一 个 新 列表 ， 而 原始 的 列表 并 不 改变 。 


这 个 区 别 ， 在 编写 布 望 修改 列表 的 函数 时 十 分 重要 。 例 如 ， 下 面 
的 函数 并 不 会 删除 列表 的 开头 : 


def bad_delete_head(t ) : 
t = t[1:] # 错 ! 


切片 操 作 会 新 建 一 个 列表 ， 而 赋值 操作 会 让 t 引用 指向 这 个 新 的 
列表 ， 但 这 些 操作 对 调用 者 没有 影响 。 
>>> t4 = [1, 2, 3 


>>> bad_delete_ head(t4) 
>>> t4 


[1, 2, 3] 


在 bad_delete_head 的 开头 ,t 和 t4 指向 同一 个 列表 。 在 函数 
最 后 ，t 指向 了 一 个 新 的 列表 ， 但 t4 仍然 指向 原先 的 那个 没有 改变 的 
列表 。 


另外 一 种 方法 是 编写 函数 创建 和 返回 一 个 新 的 列表 。 例 如 ，tail 
返回 除了 第 一 个 以 外 所 有 的 元 素 的 列表 : 


def tail(t): 
return t[1:] 


这 个 函数 不 会 修改 原始 列表 。 下 面 的 代码 展示 如 何 使 用 它 : 


>>> letters = ['a', 'b', 'c'] 
>>> rest = tail(letters) 
>>> rest 


10.13 ”调试 


对 列表 (以 及 其 他 可 变 对 象 ， 的 不 慎 使 用 ， 可 能 会 导致 长 时 间 的 
调试 。 下 面 介绍 一 些 常 见 的 隐 阱 ， 以 及 如 何 避 人 免 它 们 。 


1.， 大 部 分 列表 方法 都 是 修改 参数 并 返回 None 的 。 这 和 字符 串 的 
方法 正 相 反 ， 字 符 串 方法 新 建 一 个 字符 串 ， 并 留 着 原始 的 字符 串 不 
动 。 


如 有 果 你 习惯 于 写 下 面 这 样 的 字符 种 代码 : 


word = word.strip() 


则 容易 倾 同 于 这 么 写 列 表 代码 : 


t = t.sort() # 错 ! 


因为 sort 返回 None ， 接 下 来 对 t 进行 的 操作 很 可 能 会 失败 。 


在 使 用 列表 方法 和 操作 符 之 前 ， 应 当 仔细 阅读 文档 ， 并 在 交互 模 
式 中 测试 它们 。 


2， 选 择 一 种 风格 ， 并 坚持 不 变 。 


列表 的 问题 之 一 是 同样 的 事情 有 太 多 种 可 用 的 做 法 。 例 如 ， 要 从 
列表 中 删除 一 个 元 素 ， 可 以 使 用 pop 、remove 、del 或 者 甚至 是 切 
片 赋值 。 


要 添加 一 个 元 素 ， 可 以 使 用 append 方法 或 者 + 操作 符 。 假 设 t 是 
个 列表 ，x 十 一 个 列表 元 系 ， 下 面 的 操作 走 正 确 的 : 


t.append(x) 


.append( [x]) 


t.append(x) 
] 


在 交互 模式 中 试验 这 些 例 子 ， 确 保 你 明白 它们 的 运行 细节 。 注 意 
只 有 最 后 一 个 会 导致 运行 时 错误 ;其 他 的 3 个 都 是 合法 的 ， 但 是 它们 的 
结果 不 正确 。 


3. 通过 复制 来 避免 别名 。 


如 采 想 要 使 用 类 似 sort 的 方法 来 修改 参数 ， 但 又 需要 保留 原先 的 
列表 ， 可 以 复制 一 个 副本 : 


t = [3, 1, 2] 
t2 = t[:] 


t2.sort() 


在 这 个 例子 里 也 可 以 使 用 内 置 函 数 sorted ， 它 会 返回 一 个 新 的 排 
好 序 的 列表 ， 并 且 留 着 原先 的 列表 不 动 。 
>>> t2 = sorted(t) 


>>> t 
[3, 1, 2] 


>>> t2 
[1, 2, 3] 


10.14 ”术语 表 


列表 (list) : 值 的 序列 。 


元 素 (element) : 列表 (或 其 他 序列 ) 中 的 一 个 值 ， 也 称 为 列表 
项 。 


馈 套 列表 
索 加 如 


- 量 . 


变量 。 


(nested list) : 作为 其 他 列表 的 元 素 的 列表 。 
(accumulator) : 在 循环 中 用 于 加 和 或 者 累积 某 个 结果 的 


增加 赋值 (augmented assignment) : 使 用 类 似 += 操 作 符 来 更 新 变 


量 值 的 语句 。 


化 简 
索 积 起 来 计算 为 


(reduce) : 


映 出 
操作 。 


(map) : 


的 元 素 。 


(filter) : 


对 象 (object) : 


分 隔 符 


10.15 ”练习 


(identical) : 
(reference) : 
(aliasing) : 


(delimiter) : 


一 种 处 理 模式 ， 过 历 一 个 序列 ， 并 将 元 素 的 值 


个 单独 的 结 


一 种 处 理 模式 ， 斋 历 一 个 序列 ， 对 每 个 元 素 进行 


一 种 处 理 模 式 ， 裔 历 列表 ， 并 选择 满足 某 种 条 件 


变量 可 以 引用 的 东西 。 对 象 有 类 型 和 值 。 


(equivalent) : 拥有 相同 的 值 。 


征 同 一 个 对 象 《并 且 也 意味 着 相等 ) 。 


变量 和 它 的 值 之 间 的 关联 。 


多 个 变量 同时 引用 一 个 对 象 的 情况 。 


你 可 以 从 http://thinkpython2.com/code/list_exercises.py 下 载 这 些 练习 
的 解答 。 


练习 10-1 
编写 一 个 名 为 nested_sum 的 函数 ， 接 收 一 个 由 内 岁 的 整数 列表 
组 成 的 列表 作为 形 参 ， 并 将 内 骸 列 表 中 的 值 全 部 加 起 来 。 例 如 : 


>>> t = [[1，2]，[3]，[4，5，6]] 
>>> nested_sum(t) 
21 


练习 10-2 


编写 一 个 名 为 cumsunm 的 函数 ， 授 收 一 个 数字 的 列表 ， 返 回 昧 计 
和 ; 也 就 古 说 ， 返 回 一 个 新 的 列表 ， 其 中 第 i 个 元 素 古 原先 列表 的 前 i 
+1 个 元 素 的 和 。 例 如 : 


> 
>>> cumsum(t) 
[1, 3, 6] 


练习 10-3 


编写 一 个 钞 数 middle ， 接 收 一 个 列表 作为 形 参 ， 并 返回 一 个 新 列 
， 包 含 除 了 第 一 个 和 最 后 一 个 元 素 之 外 的 所 有 元 素 。 例 如 : 


潍 


>>> t = [1, 2, 3, 4] 
>>> middle(t) 
[2, 3] 


练习 10-4 


编写 一 个 名 为 chop 的 函数 ， 接 收 一 个 列表 ， 修 改 它 ， 删 除 它 的 第 
一 个 和 最 后 一 个 元 素 ， 并 返回 None 。 例 如 : 


>>> t = [1, 2, 3, 4] 
>>> chop(t) 
>>> t 


[2, 3] 


练习 10-5 


编写 一 个 名 为 js_sorted 的 函数 ， 接 收 一 个 列表 作为 形 参 ， 并 当 
列表 是 按照 升序 排 好 序 的 时 候 返 回 True ， 否 则 返回 False 。 


例如 : 


>>> is_sorted([1, 2, 2]) 
True 
>>> is_sorted(['b', 'a']) 


False 


练习 10-6 


两 个 单词 ， 如 果 重 新 排列 其 中 一 个 的 字母 可 以 得 到 另 一 个 ， 它 们 
互 为 回 文 (anagram) 。 编 写 一 个 名 为 is_anagram 的 函数 ， 接 收 两 个 
字符 串 ， 当 它们 互 为 回 文 时 返回 True 。 


练习 10-7 


编写 一 个 名 为 has_duplicates 的 函数 接收 一 个 列表 ， 当 其 中 任 
何 一 个 元 素 出 现 多 于 一 次 时 返回 True。 它 不 应 当 修改 原始 列表 。 


练习 10-8 


这 个 练习 谈 的 是 所 请 的 生日 怪 论 ， 你 可 以 在 
http://en.wikipedia.org/wiki/Birthday_paradox 阅 读 相 关 资 料 。 


如 有 果 你 的 班级 中 有 23 个 学 生 ， 那 么 其 中 有 两 人 生日 相同 的 概率 有 
多 大 ? 你 可 以 通过 随机 生成 23 个 生日 的 样本 并 检查 是 否 有 相同 的 匹配 
来 估计 这 个 概率 。 提 示 : 可 以 使 用 random 模块 中 的 randint 函数 来 
生成 随机 生日 。 


你 可 以 从 http://thinkpython2.com/code/birthday.py 下 载 解 管 。 
练习 10-9 


编写 一 个 函数 ， 读 取 文 件 words .txt ， 并 构建 一 个 列表 ， 每 个 元 
素 是 一 个 单词 。 给 这 个 函数 编写 两 个 版 本 ， 其 中 一 个 使 用 append 方 
法 ， 另 一 个 使 用 kt = t + [x] 的 用 法 。 哪 一 个 运行 时 间 更 长 ? 为 什 
We 


解答 : http://thinkpython2.com/code/wordlist.py ° 
练习 10-10 


要 检查 一 个 单词 是 否 出 现在 单词 列表 中 ， 可 以 使 用 in 操作 符 ， 但 
由 于 它 需 要 按 顺序 搜索 所 有 单词 ， 可 能 会 比较 慢 。 


因为 单词 是 按 字母 顺序 排列 的 ， 我 们 可 以 使 用 二 分 查找 (也 叫 作 
二 分 搜索 ) 来 加 快速 度 。 二 分 查找 的 过 程 类 似 于 在 字典 中 查找 单词 。 
从 中 间 开 始 ， 检 查 需要 找 的 单词 是 不 是 在 列表 中 间 出 现 的 单词 之 前 ， 
如 果 是 ， 则 继续 用 同样 的 方法 搜索 前 半 部 分 。 否 则 搜索 后 半 部 分 。 


不 论 哪 种 情形 ， 都 将 搜索 衬 间 减 小 了 一 半 。 如 采 单 词 列表 有 
113,809 个 单词 ， 那 么 大 概 耗费 17 步 就 能 找到 单词 ， 或 者 确认 它 不 在 列 
过 攻 


编写 一 个 函数 in_bisect ， 接 收 一 个 排 好 序 的 列表 ， 以 及 一 个 目 
标 值 ， 当 目标 值 在 列表 之 中 ， 返 回 其 下 标 ， 否 则 返回 None 。 


或 者 你 可 以 阅读 bisect 模块 的 文档 ， 并 使 用 它 ! 
解答 : http://thinkpython.com2/code/inlist.py 。 
练习 10-11 


两 个 单词 ， 如 果 其 中 一 个 是 男 一 个 的 反 向 序列 ， 则 称 它们 为 “ 反 向 
对 ”。 编写 一 个 程序 找到 单词 表 中 出 现 的 全 部 反 向 对 。 


解答 : http://thinkpython2.com/code/reverse_pair.py° 
练习 10-12 


两 个 单词 ， 如 果 从 每 个 单词 中 交错 取出 一 个 字母 可 以 组 成 一 个 新 
的 单词 ， 我 们 称 它们 为 “ 互 锁 ” (interlocking) 。 例 如 , “shoe” 和 
“cold> 可 以 互 锁 组 成 单词 “schooled”。 


解答 : http://thinkpython2.com/code/interlock.py。 鸣谢 : 这 个 练习 
启发 自 http://puzzlers.org 的 一 个 示例 。 


1 编写 一 个 程序 找到 所 有 互 锁 的 词 。 提 示 ， 不 要 穷 举 所 有 的 记 
对 ! 

2， 能 不 能 找到 “三 巨 锁 "的 单词 ? 也 就 是 ， 从 第 一 、 第 二 或 者 第 三 
个 字母 开始 ， 每 第 三 个 字母 合 起 来 可 以 形成 一 个 单词 。 


第 11 章 ”字典 


本 章 介绍 另 一 种 内 置 类 型 : 字典 。 字 典 是 Python 最 好 的 语言 特性 之 
一 ， 它 是 很 多 高 效 而 优雅 的 算法 的 基本 构建 块 。 


11.1 字典 是 一 种 映射 


字典 类 似 于 列表 ， 但 更 加 通用 。 在 列表 中 ， 下 标 必须 是 整数 ， 而 
在 字典 中 ， 下 标 (几乎 ) 可 以 是 任意 类 型 。 


字典 包含 下 标 ( 称 为 键 ) 集合 和 值 集合 。 每 个 键 都 与 一 个 值 关 
联 。 键 和 值 之 间 的 关联 被 称 为 键 值 对 (key-value pair) ， 或 者 有 时 称 
为 一 项 (item) 。 


用 数学 语言 来 描述 ， 字 典 体现 了 键 到 值 的 上 映射 ， 所 以 可 以 说 每 个 
键 “映射 ?到 一 个 值 。 作 为 示例 ， 我 们 构建 一 个 字典 ， 将 英语 单词 映射 
到 西班牙 语 上 ， 所 以 键 和 值 的 类 型 都 是 字符 串 。 

函数 dict 新建 一 个 不 包含 任何 项 的 字典 。 因 为 dict 是 内 置 函 数 
的 名 称 ， 应 当 避 免 使 用 它 作为 变量 名 。 


>>> eng2sp = dict() 
>>> eng2sp 
{} 


这 里 花 括 号 {] 表示 一 个 空 的 字典 。 想 要 给 字典 深 加 新 项 ， 可 以 使 
用 方 括号 操作 符 


>>> eng2sp['one'] = 'uno' 


这 一 行 代 码 创 建 一 个 新 项 ， 将 键 'one' 映射 到 值 'uno' 上 。 如 果 
我 们 再 次 打印 这 个 字典 ， 可 以 看 到 一 个 键 值 对 ， 以 冒号 分 隔 : 


>>> eng2sp 
{'one': 'uno'} 


这 种 输出 格式 也 同样 是 输入 的 格式 。 例 如 ， 可 以 创建 一 个 包含 3 项 
的 新 字典 : 


>>> eng2sp = {'one': ， oe 人 ee ': 'tres'} 


但 如 果 你 打印 eng2sp ， 可 能 会 觉得 奇怪 : 


>>> eng2sp 


{'one': 'uno', 'three': ' 


字典 中 键 值 对 的 顺序 可 能 并 不 相同 。 如 采 你 在 自己 的 电脑 上 输入 
相同 的 示例 ， 可 能 会 得 到 另 一 个 不 同 的 结 末 。 上 总之， 字典 中 各 项 的 顺 
序 是 不 可 预料 的 。 


但 这 并 不 是 问题 ， 因 为 字典 的 元 素 从 来 不 使 用 整数 下 标 进行 得 
找 。 相 对 地 ， 它 使 用 键 来 查找 对 应 的 值 : 


>>> eng2sp['two'] 
"doS 


如 果 键 "two ' 总 是 映射 到 值 'dos' 上 ， 那 么 各 项 的 顺序 其 实 并 不 
重要 。 


如 采 一 个 键 并 不 在 字典 之 中 ， 会 得 到 一 个 异 篆 : 


>>> eng2sp['four'] 
KeyError: 'four' 


len 画 数 可 以 用 在 字典 上 ， 它 返回 键 值 对 的 数量 : 
in 操作 符 也 可 以 用 在 字典 上 ， 它 告诉 你 一 个 值 是 不 是 字典 中 的 键 


(是 字典 中 的 值 则 不 算 ) 。 


>>> "one' in eng2sp 
True 
>>> "uno' in eng2sp 


>>> vals = eng2sp.values() 
>>> "Uno' in vals 
True 


in 操作 符 对 列表 和 字典 使 用 不 同 的 算法 实现 。 对 于 列表 ， 它 按 顺 
序 搜索 列表 的 元 素 ， 如 8.6 世 所 示 。 当 列表 变 长 时 ， 搜 索 时 间 会 随 之 变 
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而 对 于 字典 ，Python 使 用 一 个 称 为 散 列 表 (hashtable) 的 算法 。 它 
有 一 个 值得 注意 的 特点 : 不 管 字典 中 有 多 少 项 ，in 操作 符 花 费 的 时 间 
都 差不多 。 我 会 在 21.4 市 中 解释 其 中 的 原因 ， 但 最 好 再 多 读 几 章 ， 这 样 
才 可 能 看 懂 解 释 的 内 容 。 


11.2 ”使 用 字典 作为 计数 器 集合 


假设 给 定 一 个 字符 串 ， 你 想 要 计算 每 个 字母 出 现 的 次 数 。 有 儿 种 
可 能 的 实现 方法 : 


1. 你 可 以 创建 26 个 变量 ， 每 个 变量 对 应 字母 表 上 的 一 个 字母 。 接 
着 遍历 字符 种， 对 每 一 个 字符 ， 增 加 对 应 的 计数 右 。 你 可 能 需要 使 用 
NT 


2， 你 可 以 创建 一 个 包含 26 个 元 素 的 列表 。 接 着 可 以 将 每 个 字符 转 
换 为 一 个 数字 (使 用 内 置 画 数 ord ) ， 使 用 这 个 数字 作为 列表 的 下 
标 ， 并 增加 对 应 的 计数 器 。 


3. 你 可 以 建立 一 个 字典 ， 以 字符 作为 链 ， 以 计数 器 作为 相应 的 
值 。 第 一 次 遇 到 某 个 字符 时 ， 在 字典 中 添加 对 应 的 项 。 之 后 可 以 增加 
一 个 已 经 存在 的 项 的 值 。 


这 几 种 方案 进行 相同 的 计算 ， 但 实现 计算 的 方式 不 一 样 。 


实现 (implementation) 是 进行 某 种 计算 的 一 个 具体 方式 ， 有 的 实 
现 比 其 他 的 更 好 。 例 如 ， 字 典 实 现 的 优势 之 一 是 我 们 并 不 需要 预先 知 
道 字符 串 中 可 能 出 现 哪些 字母 ， 因 而 只 需 为 真正 出 现 过 的 字母 分 配 空 
间 。 


下 面 是 这 个 实现 的 代码 : 


def histogram(s): 
d = dict() 
for c in s: 
if c not in d: 
d[c] = 1 


else: 
d[c] += 1 
return d 


这 个 画 数 的 名 称 是 直方 图 《histogram) ， 它 是 一 个 统计 学 术语 
表示 一 个 计数 器 (或 者 说 频率 ) 的 集合 。 


函数 的 第 一 行 创建 一 个 空 的 字典 。for 循环 遍历 字符 串 。 每 次 迭 
代 中 ， 如 有 果 字 符 c 不 在 字典 中 ， 我 们 束 创 建 一 个 新 项 ， 其 键 是 c ， 其 值 
初始 化 为 1 《因为 我 们 已 经 见 到 这 个 字符 一 次 了 ) 。 如 果 c 已 经 在 字典 
之 中 ,我 们 增加 d[c] 。 


下 面 是 这 个 函数 的 使 用 方式 : 


>>> h = histogram( 'brontosaurus ' ) 


这 个 直方 图 显示 ， 字 母 'a' 和 'b' 出 现 了 1 次 ; '0 ' 出 现 了 两 次 ， 
依 此 类 推 。 


字典 有 一 个 方法 get ， 接 收 一 个 键 以 及 一 个 默认 值 。 如 采 键 出 现 
在 字典 中 ，get 返回 对 应 的 值 ， 否 则 它 返 回 默 认 值 。 例 如 : 


>>> h = histogram('a') 


作为 练习 ， 使 用 get 将 histogram 写 得 更 紧 读 一 些 。 你 应 当 可 以 
消除 掉 if 语句 。 


11.3 ”循环 和 字典 


如 果 在 for 循环 中 使 用 字典 ， 会 再 历 字 典 的 键 。 例 如 ， 
print_hist 函数 打印 字典 的 每 一 个 键 以 及 对 应 的 值 : 


def print_hist(h): 
for c in h: 


print(c, h[c]) 


下 面 是 这 个 函数 输出 的 样子 : 


>>> h = histogram('parrot') 
>>> print_hist(h) 
a 


同样 地 ， 键 的 出 现 没 有 特定 的 顺序 。 要 按 顺序 遍历 所 有 键 ， 可 以 
使 用 内 置 函数 sorted : 


>>> for key in sorted(h) 
print(key, h[key]) 


11.4 反问 查找 


给 定 一 个 字典 d 和 键 K ， 找 到 对 应 的 值 v = d[k] 非常 容易 。 这 个 
操作 称 为 查找 (lookup) 。 


但 是 如 果 有 v ， 而 想 找 到 k 时 怎么 办 ? 这 里 有 两 个 问题 ， 站 和 完 ， 可 
能 存在 多 个 键 映 射 到 同一 个 值 v 上 。 随 不 同 的 应 用 场景 ， 也 许可 以 挑 其 
中 一 个 ， 或 者 也 许 需 要 建立 一 个 列表 来 保存 所 有 的 键 。 其 次 ， 并 没有 
可 以 进行 反 向 查找 的 简单 语法 ， 你 需要 使 用 搜索 。 


下 面 古 一 个 函数 ， 接 收 一 个 值 ， 并 返回 映射 到 该 值 的 第 一 个 键 : 


def reverse_ lookup(d, v): 
for k in d: 
If d[k] == v: 
return k 


raise LookupError() 


这 个 玉 数 古 搜 索 模 式 的 又 一 个 示例 。 但 它 使 用 了 一 个 我 们 还 没 见 


过 的 语言 特性 ，raise 语句 。raise 语句 会 生成 一 个 异常 ， 在 这 个 


例子 里 它 生 成 一 个 LookupError ， 这 是 一 个 内 置 异常 ， 通 常用 来 表示 
查找 操作 失败 。 


如 采 我 们 到 达 了 循环 的 结尾 ， 就 意味 着 v 在 字典 中 没有 作为 值 出 现 
过 ， 所 以 我 们 掀 出 一 个 异 曾 。 


下 面 的 例子 展示 了 一 个 成 功 的 反 癌 查找: 


histogram( 'parrot ') 
reverse_lookup(h, 2) 


以 及 一 个 不 成 功 的 反问 查找 : 


>>> k = reverse lookup(h, 3) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 5, in reverse lookup 
LookupError 


当 你 自己 抛 出 异常 时 ， 效 果 和 Python 抛 出 异常 是 一 样 的 ， 它 会 打印 
出 一 个 回溯 和 一 个 错误 信息 。 


raise 语句 也 可 以 接收 一 个 可 选 的 参数 用 来 详细 摘 述 错误 。 例 
如 : 
>>> raise LookupError('value does not appear in the dictionary') 


Traceback (most recent call last): 
File "<stdin>", line 1, in ? 


LookupError: value does not appear in the dictionary 


反 辐 得 找 远 远 慢 于 正 癌 查找 ， 如 采 频 崇 这 么 做 ， 或 者 字典 非 钊 大 
时 ， 会 对 程序 的 性 能 有 很 大 影响 。 


11.5 ”字典 和 列表 


列表 可 以 在 字典 中 以 值 的 形式 出 现 。 例 如 ， 如 果 你 遇 到 一 个 将 字 
母 映 射 到 频率 的 字典 ， 可 能 会 想 要 反 转 它 ， 也 就 是 说 ， 建 立 一 个 字 
典 ， 将 频率 映射 到 字母 上 。 因 为 可 外 g 出 现 多 个 字母 频率 相同 的 情况 
在 反 转 的 字典 中 ， 每 项 的 值 应 当 是 字母 的 列表 。 


这 里 是 一 个 反 转 字典 的 函数 : 


def invert_dict(d): 
inverse = dict() 
for key in d: 
val = d[key!] 
if val not in inverse: 


inverse[val] = [key] 
else: 
inverse[vall].append(key) 
return inverse 


每 次 循环 中 ，key 从 d 中 获得 一 个 键 ， 而 val 获得 相应 的 值 。 如 
果 val 不 在 inverse 字典 中 ， 和 意味 着 我 们 还 没有 见 到 过 它 ， 所 以 新 建 
一 个 项 ， 并 将 它 初始 化 为 一 个 单 件 (singleton， 即 只 包含 一 个 元 素 的 
列表 ) 。 否则 我 们 已 经 见 过 这 个 值 了 ， 因 此 将 相应 的 键 附 加 到 列表 末 
六 


下 面 是 一 个 示例 : 


>>> hist = histogram( 'parrot ' ) 
>>> hist 


人 
>>> inverse = invert_dict(hist) 

>>> inverse 

Rh Ly 


图 11-1 是 显示 hist 和 :inverse 的 状态 图 。 字 上 典 使 用 一 个 上 方 标 
明 dict 的 图 框 表示 ， 内 部 包含 刍 值 对 。 如 果 值 是 整数 、 浮 点 数 或 字符 
串 ， 我 会 把 它们 画 到 图 框 内 ， 但 我 常常 会 将 列表 画 在 图 框 之 外 ， 以 便 
保持 状态 图 的 简洁 。 
dict dict list 
iNnv 


图 11-1 ”状态 图 


如 本 例 所 示 ， 列 表 可 以 用 作 字 典 的 值 ， 但 它们 不 能 用 作 键 。 如 采 
尝试 的 话 ， 会 得 到 如 下 的 结 


Traceback (most recent call last): 


File "<stdin>", line 1, in ? 
TypeError: list objects are unhashable 


之 前 我 提 到 过 字典 是 通过 散 列 表 的 方式 实现 的 ， 这 意味 着 键 必须 
是 可 散 列 (hashable) 的 。 


散 列 是 一 个 函数 ， 接 收 〈 任 意 类 型 ) 的 值 并 返回 一 个 整数 。 字 典 
使 用 这 些 被 称 为 获 列 值 的 整数 来 休 存 和 查找 刍 值 对 。 


这 套 系统 当 键 不 可 变 时 ， 可 以 正确 工作 。 但 如 果 像 列表 这 样 ， 键 
征 可 变 的 话 ， 则 会 有 不 好 的 事情 发 生 。 例 如 ， 痢 建 一 个 键 值 对 时 ， 
Python 将 键 进 行 散 列 并 存储 到 对 应 的 地 方 。 如 采 修 改 了 键 并 再 次 散 列 ， 
它 会 指 疝 一 个 不 同 的 地 方 。 在 那 种 情况 下 ， 会 导致 同一 个 健 有 两 个 条 
目 ， 或 者 可 能 找 不 到 某 个 键 。 不 论 如 何 ， 字 典 将 无 法 正确 工作 。 
Hs 


因此 键 必 须 是 可 散 列 的 ， 而 类 似 列 表 这 样 的 可 变 类 型 生 不 可 散 列 
绕 过 这 种 限制 的 最 向 


最 简单 办 法 是 使 用 元 组 ， 


F 一 章 会 有 详细 介绍 。 
因为 字典 是 可 变 的 ， 它 也 不 能 用 作 键 ， 但 它 可 以 用 作 字典 的 值 。 
11.6 ” 备 访 


如 琳 你 竹 i 


会 


试 过 6.7 节 中 的 fibonacci 函数 ， 可 能 会 注意 到 ， 提 供 
的 参数 越 大 ， 函 数 运 行 的 时 间 越 长 ， 并 且 运 行 时 间 增 长 很 快 


为 了 明白 为 什么 会 这 样 ， 考 虑 图 11-2， 它 展示 了 fibonocci 函数 
n=4 时 的 调用 图 。 


调用 图 显示 了 一 组 函数 帧 ， 并 用 箭头 将 函数 的 帧 和 它 调 用 的 函数 
帧 连接 起 来 。 在 图 的 顶端 ，n=4 的 fijbonacci 调用 了 n=3 和 n=2 的 


fibonacci。 同 样 地 ，n=3 的 fibonacci 调用 了 n=2 和 n=1 的 
fibonacci。 依 此 类 推 。 


数 一 下 fibonacci(0) 和 fibonacci(1) 被 调用 了 多 少 次 。 上 
是 本 问题 的 一 个 很 低 效 的 解决 方案 ， 而 且 当 参数 变 大 时 ， 事 情 会 变 f 
更 糟 。 


一 个 解决 办 法 是 记录 已 经 计算 过 的 值 ， 并 将 它们 保存 在 一 个 字典 
中 。 将 之 前 计算 的 值 保 存 起 来 以 便 后 面 使 用 的 方法 称 为 备 忘 
(memo) 。 下 面 是 一 个 使 用 了 备 忘 的 fibonacci 版 本 : 


known = {0:0, 1:1} 


def fibonacci(n): 
if n in known: 
return known[n] 


res = fibonacci(n-1) + fibonacci(n-2) 
known[n] = res 
return res 


fibonacci 


D4 


fibonacci 
n 一 = 3 
fibonacci fibonacci 
n 一 = 2 n 一 := 1 
fibonacci fibonacci 
n 一 = 1 n 一 = 0 


known 是 一 个 用 来 记录 我 们 已 知 的 Fibonacci 数 的 字典 。 开 始 时 它 
有 两 项 : 0 了 轴 射 到 0， 以 及 1 映射 到 1。 


fibonacci 
n 一 -= 2 
fibonacci fibonacci 
n 一 = 1 n 一 = 0 


图 11-2 调用 图 


每 当 fibonacci 被 调用 时 ， 它 会 先 检查 known 。 如 果 结 果 已 经 
存在 ， 则 可 以 立即 返回 。 如 果 不 存在 ， 它 需要 计算 这 个 新 值 ， 将 其 添 
加 进 字典 ， 并 返回 。 


如 采 你 运行 fibonacci 的 这 个 版 本 ， 并 将 其 与 原始 版 本 进行 比较 ， 你 
会 发 现 ， 这 个 版 本 快 得 多 。 


11.7 全 局 变量 


在 前 一 个 例子 中 ，known 是 在 函数 之 外 创建 的 ， 所 以 它 属 于 被 称 
为 ”main ”的 特殊 帧 。_main_ _ 之 中 的 变量 有 时 被 称 为 全 局 变 
量 ， 因 为 它们 可 以 在 任意 函数 中 访问 。 和 局 部 变量 在 函数 结束 时 就 消 
失 不 同 ， 全 局 变量 可 以 在 不 同 函 数 的 调用 之 间 持 久 存 在 。 


全 局 变量 常常 用 作 标 志 (flag) ; 它 是 一 种 布尔 变量 ， 可 以 标志 一 
个 条 件 是 人 否 为 真 。 例 如 ， 有 的 函数 使 用 一 个 叫 verbose 的 标志 来 控制 
输出 的 详细 程度 : 


verbose = True 


def example1( ): 


if verbose: 
print('RuNning example1') 


如 有 果 你 淮 试 给 全 局 变量 重 狐 赋值 ， 可 能 会 感到 惊讶 。 下 面 例子 的 
本 意 是 想 记录 函数 是 否 被 调用 过 : 


been_called = False 


def example2(): 


been_called = True 


但 当 你 运行 它 时 ， 会 发 现 been_called 的 值 并 不 会 变化 。 问 题 在 
于 函数 example2 会 新 建 一 个 局 部 变量 been_called 。 局 部 变量 在 
函数 结束 时 就 会 消失 ， 并 且 对 全 局 变量 没有 任何 影响 。 


要 想 在 函数 中 给 全 局 变量 重新 赋值 ， 你 需要 在 使 用 它 之 前 先 声 明 


这 个 全 局 变量 : 


been_called = False 


def example2(): 


global been_called 
been_called = True 


global 语句 告诉 编译 器 , “在 这 个 画 数 里 ， 当 我 说 
been_called 时 ， 我 指 的 是 全 局 变量 ， 不 要 新 建 一 个 局 部 变量 。” 


下 面 是 一 个 符 试 更 新 全 局 变量 的 例子 : 


count 


def example3(): 


count = count + 1 


如 采 运 行 它 ， 会 得 到 : 


UnboundLocalError: local variable 'count' referenced before 
assignment 


Python 会 假设 count 是 局 部 的 ， 在 这 种 假设 下 你 在 写 入 它 之 前 先 
读 取 了 。 解 决 方案 也 十 声明 count 为 全 局 变量 。 


def example3(): 
global count 


count += 1 


如 有 果 全 局 变量 指向 的 是 可 变 的 值 ， 可 以 不 用 声明 该 变量 束 可 以 修 
改 该 值 : 


known = {0:0, 1:1} 


def example4(): 


known[2] = 1 


所 以 你 可 以 添 加、 删除 和 蔡 换 一 个 全 局 的 列表 或 字典 的 元 素 ， 但 
如 采 想 要 给 全 局 变量 重新 赋值 ， 则 需要 声明 它 : 


def example5(): 
global known 
known = dict() 


全 局 变量 很 有 用 ， 但 十 如 琳 使 用 太 多 ， 并 且 频 粽 修改， 可 能 会 让 
代码 比较 难 调 试 。 


11.8 调试 


在 使 用 更 大 的 数据 集 时 ， 通 过 打印 和 手动 检查 输出 的 方式 来 调试 
已 经 变 得 很 傈 拙 了 。 下 面 是 一 些 调试 大 数据 集 的 建议 。 


缩小 输入 


如 采 可 能 ， 减 小 数据 集 的 尺寸。 例如 ， 程 序 如 采 读 入 文本 文件 ， 
可 以 从 开头 10 行 开始 ， 或 者 使 用 你 能 找到 的 最 小 样本 。 你 可 以 编辑 文 
件 本 身 ,或 者 (更 好 地 ) 修改 程序 让 它 只 读 入 前 n 行 。 


如 采 出 现 了 错误 ， 可 以 调 小 n ， 小 到 足够 展现 出 错误 的 最 小 程度 ， 
并 在 修改 之 后 逐渐 增 大 n 。 


检查 概要 信息 和 类 型 


与 其 打印 和 检查 整个 数据 集 ， 可 以 考虑 打印 出 数据 的 概要 信息 : 
例如 ， 字 典 中 条 目的 数量 ， 或 者 一 个 列表 中 数 的 和 。 


运行 时 错误 的 一 个 稍 见 原因 是 茶 个 值 的 类 型 不 对 。 调 试 这 种 错 充 
角 般 


时 ， 常 常 只 需要 打印 出 值 的 类 型 就 足够 了 。 
编写 目 检查 逻辑 


有 时 候 可 以 写 代 码 目 动 检查 错误 。 例 如 ， 如 果 你 要 计算 一 系列 数 
的 平均 值 ， 可 以 检查 结 采 是 否 比 列表 中 最 大 的 数 小 ， 或 者 比 最 小 的 数 
大 。 这 种 检查 称 为 “健全 检查 ” (sanity check) ， 因 为 它 会 发 现 那些 “发 
疯 ” 的 结果 。 


另 一 种 检查 可 以 对 比 两 种 不 同 的 计算 的 结果 ， 查 看 它们 是 否 一 
致 。 这 样 的 检查 称 为 "一致 性 检查 ”。 


格式 化 输出 


格式 化 调试 输出 ， 可 以 更 容易 发 现 错误 。 我 们 在 6.9 世 中 已 经 看 到 
过 一 个 例子 。pprint 模块 提供 了 一 个 pprint 函数 ， 可 以 将 内 置 类 型 
的 值 以 更 加 入 性 化 的 可 读 的 格式 打印 出 来 。 (pprint 代表 “pretty 


print” ° ) 


另外 ， 再 提醒 一 次 ， 花 费时 间 构建 脚手架 代码 ， 可 以 减少 未 来 进 
行 调试 的 时 间 。 


11.9 ”术语 表 


映射 (mapping) : 一 个 集合 中 的 每 个 元 素 与 男 一 个 集合 中 的 元 素 
所 产生 的 关联 


字典 (dictionary) : 从 键 到 对 应 的 值 的 映射 。 
键 值 对 (key-value pair) : 键 到 值 的 映射 的 展示 。 


项 (item) : 在 字典 中 ， 键 值 对 的 另 一 个 名 称 。 


键 (key) : 字典 中 出 现在 键 值 对 的 前 一 部 分 的 对 象 。 


值 (value) : 字典 中 出 现在 键 值 对 的 后 一 部 分 的 对 象 。 这 上 比 我 们 
之 前 提 到 的 “ 值 ” 更 加 具体 。 


实现 (implementation) : 进行 计算 的 一 个 具体 方式 。 


散 列 表 (hashtable) : Python 字典 的 实现 用 的 算法 。 


散 列 函数 ”(hash function) : 散 列表 中 用 来 计算 一 个 键 的 位 置 的 函 
Ro 


可 散 列 (hashable) : 拥有 散 列 函数 的 类 型 。 不 可 变 类 型 ， 诸 如 整 
数 、 浮 点 数 和 字符 串 都 古 可 散 列 的 ， 可 变 类 型 ， 诸 如 列表 和 字典 ， 部 
征 不 可 散 列 的 。 


查找 〈lookup) : 字典 的 一 个 操作 ， 接 收 一 个 键 ， 并 找到 它 对 应 
的 值 。 


反问 查找 。 (reverse lookup) : 字典 的 一 个 操作 ， 通 过 一 个 值 来 找 
到 它 对 应 的 一 个 或 多 个 键 。 


raise 语句 (raise statement) : 一 个 〈 故 意 ) 抛 出 异常 的 语句 。 


单 件 (singleton) : 只 包含 一 个 元 素 的 列表 (或 其 他 序列 ) 。 


调用 图 (call graph) : 一 个 用 来 展示 程序 运行 中 创建 的 每 一 帧 的 
关系 的 图 。 使 用 荫 头 连接 每 个 调用 者 和 被 调用 者 。 


备 生 (memo) : 将 计算 的 结果 存储 起 来 ， 以 避免 将 来 进行 不 必要 
的 计算 。 


全 局 变量 (global variable) : 在 函数 之 外 定义 的 变量 。 全 局 变量 
可 以 在 任何 函数 中 访问 。 


全 局 语句 (global statement) : 声明 变量 名 为 全 局 的 语句 。 


标志 (flag) : 用 于 标志 一 个 条 件 是 否 为 真 的 布尔 变量 。 


声明 (declaration) : 类 似 于 global 这 样 的 用 于 通知 解释 器 关于 
一 个 变量 的 信息 的 语句 。 


11.10 ”练习 
练习 11-1 


编写 一 个 函数 ， 读 入 words .txt 中 的 单词 ， 并 将 其 作为 键 保存 到 
一 个 字典 中 。 了 字典 的 值 是 什么 并 不 重要 。 然 后 你 束 可 以 使 用 in 操作 符 


快速 检查 一 个 字符 串 是 否 在 这 个 字典 中 。 


如 有 条 你 做 过 了 练习 10-10， 可 以 将 这 个 实现 与 列表 的 in 操作 符 以 及 
二 分 查找 进行 速度 的 对 比 。 


练习 11-2 


阅读 字典 方法 setdefault 的 文档 ， 并 使 用 它 来 写 一 个 更 简洁 的 


invert_dict 。 
解答 : http://thinkpython2.com/code/invert_dict.py° 


练习 11-3 


将 练习 6-2 中 的 Ackermann 范 数 改 为 备 饼 化 的 版 本 ， 并 查看 备 忘 化 
之 后 是 否 能 让 它 运 行 更 大 的 参数 。 提 示 : 不 能 。 


解答 : http://thinkpython2.com/code/ackermann_memo.py ° 
练习 11-4 


如 果 你 做 过 练习 10-7， 则 已 经 有 一 个 接受 了 列表 作为 形 参 的 函数 
has_duplicates ， 当 列表 中 有 任意 元 素 出 现 多 于 1 次 时 返回 True 。 


使 用 字典 编写 一 个 更 快 、 更 简单 的 has_duplicates 。 
解答 : http://thinkpython2.com/code/has_duplicates.py 。 


AM 了 11-5 


两 个 单词 ， 如 果 可 以 使 用 轮转 操作 将 一 个 转换 为 另 一 个 ， 则 称 
为 “轮转 对 ” (参见 练习 8-5 中 的 rotate_word 画 数 ) 


编写 一 个 程序 ， 读 入 一 个 单词 表 ， 并 找到 所 有 的 轮转 对 。 
解答 : http://thinkpython2.com/code/rotate_pairs.py ° 
练习 11-6 


下 面 是 《车 迷 天 下 》 市 目 中 的 男 一 个 谜 题 


(http://www.cartalk.com/content/ puzzlers) : 


这 个 访 题 是 一 个 叫 Dan O’Leary 的 伙计 寄 过 来 的 。 他 曾经 过 到 一 个 
单 首 往 、5 了 字母 的 第 用 单词 ， 有 如 下 所 述 的 特殊 属性 。 当 你 删除 第 一 个 
字母 时 ， 剩 下 的 字母 组 成 原单 词 的 一 个 同音 词 ， 即 发 音 完全 相同 的 
词 。 将 第 一 个 字母 放 回 去 ， 并 删除 第 二 个 字母 ， 结 末 也 是 原单 词 男 一 


个 同音 词 。 问 题 是 ， 这 个 单词 是 什么 ? 


接 下 来 我 给 你 一 个 示例 ， 但 它 并 不 能 完全 符合 条 件 。 我 们 看 这 个 5 
字母 单词 “wrack ”，W-R-A-C-K， 也 就 是 “wrack with pain” (“ 吾 来 伤害 
”) 里 的 那个 词 。 如 果 我 删 掉 第 一 个 字母 ， 会 剩 下 一 个 4 字母 的 单词 ， 
“R-A-C-K”。 也 就 是 ，“Holy cow, did you see the rack on that buck! It 
must have a nine-pointer!”(“ 天 哪 ! 你 看 到 那 匹 雄 鹿 的 亨 角 了 吗 ! 一 定 
有 9 个 特 角 ! ”) 中 的 那个 词 。 它 是 一 个 完美 的 同音 词 。 但 如 果 你 
把 “w” 放 回去 ， 并 删 掉 “> ， 会 得 到 单词 “wack”， 也 是 一 个 真实 单词 ， 但 
它 读音 和 其 他 两 个 不 一 样 。 


但 束 Dan 和 我 所 知 ， 至 少 有 一 个 单词 能 够 通过 删除 前 两 个 字母 得 到 


两 个 同音 词 。 问 题 是 ， 这 个 单词 是 什么 ? 


你 可 以 使 用 练习 11-1 中 的 字典 来 检测 一 个 字符 串 是 否 出 现在 单词 表 
ES 


要 检查 两 个 单词 是 不 是 同音 词 ， 可 以 使 用 CMU 发 音 词 典 。 你 可 以 
从 http://www.speech.cs.cmu.edu/ cgi-bin/cmudict 或 者 
http://thinkpython2.com/ code/c06d 下 载 它 ， 也 可 以 下 载 
http://thinkpython2.com/code/pronounce.py， 其 中 提供 了 一 个 叫 作 
read_dictionary 的 函数 来 读 入 发 音 词典 并 返回 一 个 Python 字典 ， 
将 每 个 单词 映射 到 表示 其 主要 读 首 的 字符 串 上 。 


编写 一 个 程序 ， 列 出 所 有 可 以 解答 这 个 谜 题 的 单词 。 


解答 : http://thinkpython2.com/code/homophone.py ° 


第 12 章 ”元 组 


本 章 介 绍 另 外 一 种 内 置 类 型 一 一 元 组 ， 并 展示 列表 、 字 典 和 元 组 
三 者 如 何 一 起 工作 。 我 还 会 介绍 一 种 很 有 用 的 可 变 长 参数 列表 功能 : 
收集 操作 符 和 分 散 操作 符 。 


请 注意 : 元 组 (tuple) 这 个 词 的 读音 并 没有 统一 标准 。 有 些 人 会 
读 成 “tuh-ple”， 与 “supple” 同 首 ， 但 在 程序 设计 界 ， 大 多 数 人 都 读 
作 “too-ple”， 与 “quadruple” 同 首 。 


12.1 元 组 是 不 可 变 的 


元 组 是 值 的 一 个 序列 。 其 中 的 值 可 以 是 任何 类 型 ， 并 且 按 照 整数 
下 标 索 引 ， 所 以 从 这 方面 看 ， 元 组 和 列表 很 像 。 元 组 和 列表 之 间 的 重 
要 区 别 是 ， 元 组 是 不 可 变 的 。 


语法 上 ， 元 组 就 是 用 去 号 分 隔 的 一 列 值 


看 要 新 建 只 包含 一 个 元 妈 的 元 组 ， 需 要 在 后 面 添加 一 个 去 号 : 


>>> t1 = 'a', 
>>> type(t1) 


<class 'tuple'> 


而 用 括号 括 起 来 的 单独 的 值 并 不 是 元 组 : 


>>> t2 = ("a') 


新 建 元 组 的 另 一 种 形式 是 使 用 内 置 画 数 tuple。 不 带 参数 时 ， 它 
会 新 建 一 个 空 元 组 : 


>>> t = tuple() 


如 果 参 数 是 一 个 序列 (字符 串 、 列 表 或 者 元 组 ，， 结 果 就 是 一 个 
包含 序列 的 元 于 的 元 组 : 


>>> t = tuple('lupins') 
>>> t 


(“1 i 'p', 


因为 tuple 十 内 置 玉 数 的 名 称 ， 所 以 应 当 避 人 免 用 它 作为 变量 名 
称 。 


大 多 数列 表 操作 也 可 以 用 于 元 组 。 方 括号 操作 符 可 以 用 下 标 取得 


而 切片 操作 符 选 择 一 个 范围 内 的 元 素 : 


>>> t[1:3] 
('b'， “0”) 


但 如 果 笑 斌 修改 元 组 中 的 一 个 元 素 ， 会 得 到 错误 : 


>>> t[0] = "A' 
TypeError: object doesn't support item assignment 


由 于 元 组 有 古 不 可 变 的 ， 所 以 不 能 修改 它 的 元 素 。 但 是 可 以 将 一 个 
元 组 替换 为 男 一 个 : 


>>> t= ('A',) + t[1:] 
>>> t 


('A', 'b', 'e') 


这 条 语句 生成 新 元 组 ， 然 后 使 t 引用 它 


关系 运算 符 适 用 于 元 组 和 其 他 序列 。Python 从 比较 每 个 序列 的 第 
一 个 元 素 开 始 。 如 果 它 们 相等 ， 它 就 继续 比较 下 一 个 元 素 ， 依 次 类 
推 ， 直 到 它 找 到 不 同 元 素 为 止 。 子 序列 元 素 不 在 考虑 之 列 (尽管 它们 
实际 上 很 大 ) 。 


>>> (0, 1, 2) < (0, 3, 4) 
True 
>>> (0, 1, 2000000) < (0, 3, 4) 


True 


12.2 ”元 组 赋值 


i 使 用 传统 的 赋值 方式 ， 需 要 使 用 
一 个 临时 变量 。 例 如 ， 要 交换 a 和 b : 


>>> temp = a 
>>> a = b 
>>> b = temp 


这 种 解决 方案 很 笨拙 ， 而 元 组 赋值 则 更 优雅 


Ce 右边 是 表达 式 的 元 组 。 每 个 值 会 被 赋值 
给 相应 的 变量 。 右 边 所 有 的 表达 式 ， 都 会 在 任何 赋值 操作 进行 之 前 完 
成 求 值 


边 变 量 的 个 数 和 右边 值 的 个 数 必须 相同 : 


>>> af b = 1, 2, 3 
ValueError: too many values to unpack 


更 通用 地 ， 右 边 可 以 是 任意 类 型 的 序列 (字符 串 、 列 表 或 元 
组 ) 。 例 如 ， 想 要 将 电子 邮件 地 址 拆 分 成 用 户 名 和 域名 ， 可 以 这 人 么 


>>> addr = 'monty@python.org' 
>>> uname, domain = addr.split('@') 


split 返回 两 个 元 素 的 列表 ; 第 一 个 元 素 被 赋值 到 uname ， 第 二 
个 到 domain 上 。 


"monty 
>>> domain 


'python.org' 


12.3 ”作为 返回 值 的 元 组 


严格 地 说 ， 函 数 只 能 返回 一 个 值 ， 但 如 果 返 回 值 是 元 组 的 话 ， 效 
果 和 返回 多 个 值 差 不 多 。 例 如 ， 如 果 将 两 个 整数 相 除 ， 得 到 商 和 余 
数 ， 那 么 先 计 算 x/y 再 计算 x%y 并 不 高 效 。 更 好 的 方法 是 同时 计算 它 
们 。 


内 置 钞 数 dijvmod 接收 两 个 参数 ， 并 返回 两 个 值 的 元 组 ， 即 商 和 
余数 。 可 以 将 结果 存 为 一 个 元 组 : 
>>> t = divmod(7, 3) 


>>> t 
(2, 1) 


或 者 可 以 使 用 元 组 赋值 来 分 别 存储 结 末 中 的 元 素 : 


>>> quot, rem = divmod(7, 3) 
>>> quot 


>>> rem 
1 


下 面 是 返回 一 个 元 组 的 函数 的 示例 : 


def min_max(t): 
return min(t), max(t) 


: 


max 和 min 都 是 内 置 函数 ， 分 别 返 回 一 个 序列 的 最 大 值 和 最 小 
值 。min_max 计算 这 两 个 值 并 将 它们 作为 一 个 元 组 返回 。 


12.4 ”可 变 长 参数 元 组 


函数 可 以 接收 不 定 个 数 的 参数 。 以 * 开头 的 参数 名 会 收集 
(gather) 所 有 的 参数 到 一 个 元 组 上 。 例 如 ，printall 接收 任意 个 
数 的 参数 并 打印 它们 : 


def printall(*args): 
print (args) 


收集 参数 可 以 使 用 任何 你 想 要 的 名 称 ， 但 按 惯例 通 肖 使 用 args 
。 下 面 是 函数 如 何 工作 的 一 个 例子 : 


>>> printall(1, 2.0, '3') 
(1, 2.0, '3') 


收集 的 反面 是 分 散 (scatter) 。 如 采 有 一 个 序列 的 值 而 想 将 它们 
作为 可 变 长 参数 传 入 到 函数 中 ， 可 以 使 用 * 操作 符 。 例 如 ，divmod 
正好 接收 两 个 参数 ， 但 它 不 接收 元 组 : 


>>> t = (7, 3) 
>>> divmod(t ) 
TypeError: divmod expected 2 arguments, got 1 


但 如 采 将 元 组 分 散 ， 束 可 以 用 了 : 


>>> divmod(*t) 
(2, 1) 


很 多 内 置 函 数 使 用 可 变 长 参数 元 组 。 例 如 ，max 和 min 都 可 以 接 
收 任意 个 数 的 参数 : 


>>> max(1, 2, 3) 


: 


但 是 sum 并 不 这 样 。 


>>> sum(1, 2, 3) 
TypeError: sum expected at most 2 arguments, got 3 


作为 练习 ， 编 写 一 个 画 数 sumall ， 接 收 任意 个 数 的 参数 并 返回 
它们 的 和 。 


12.5 ”列表 和 元 组 


zip 是 一 个 内 置 贸 数 ， 接 收 两 个 或 多 个 序列 ， 并 返回 一 个 元 组 列 
表 。 每 个 元 组 包含 来 目 每 个 序列 中 的 一 个 元 素 。 这 个 函数 的 名 字 取 和 目 
拉链 (zipper) ， 它 可 以 将 两 行 链 牙 交替 连接 起 来 。 


下 面 的 例子 将 字符 串 和 一 个 列表 “ 拉 ? 到 一 起 : 


>>> S = 'abc' 
>>> t = [9, 1, 2] 
>>> zip(s, t) 


<zip object at Ox7f7d0a9e7c48> 


结果 是 一 个 zip 对 象 ， 它 知道 如 何 遍 历 每 个 元 素 对 。 使 用 zip 
最 常用 的 方式 是 在 for 循环 中 : 


>>> for pair in zip(s, t): 
print(pair) 


('a', 0) 
('b', 1) 
('c', 2) 


zip 对 和 象 是 一 种 迄 代 器 ， 即 用 来 欠 代 访问 一 个 序列 的 对 象 。 迭 代 
亏 与 列表 有 些 方面 类 似 ， 但 与 列表 不 同 的 是 ， 迭 代 万 不 能 使 用 下 标 来 
选择 对 象 。 


如 果 需 要 使 用 列表 的 操作 符 和 方法 ， 可 以 利用 zip 对 象 制作 一 个 
列表 : 


>>> list(zip(s, t)) 
[('a', 0), ('b', 1), ('c', 2)] 


结果 是 一 个 由 元 组 组 成 的 列表 。 在 本 例 中 ， 每 个 元 组 包含 子 符 串 
中 的 一 个 字符 ， 以 及 列表 中 对 应 的 一 个 元 素 。 


如 有 果 友 列 之 间 的 长 度 不 同 ， 则 结果 的 长 度 是 所 有 序列 中 最 短 的 那 


A 


>>> Tist(zip(， Anne', 'Elk')) 
[OA EY), (Cn, 2), (Cn', 'k')] 


可 以 在 for 循环 中 使 用 元 组 赋值 来 访问 元 组 的 列表 : 


t= [('a', 0), ('b', 1), ('c', 2)] 
for letter, number in t: 


print (number, letter) 


每 次 循环 中 ，Python 选 择 列 表 中 的 下 一 个 元 组 ， 并 将 其 元 素 赋 值 
给 letter 和 number 变量 。 这 个 循环 的 输出 如 下 : 


DPO 
OD 


如 有 果 组 合 使 用 zip 、for 循环 以 及 元 组 赋值 ， 可 以 得 到 一 种 有 用 
的 模式 ， 用 于 同时 遍历 两 个 或 更 多 序列 。 例 如 ，has_match 函数 接 
收 两 个 序列 ，t1 和 t2 ， 并 当 存 在 一 个 下 标 i 保证 t1[i] == t2[i] 
时 返回 True : 


def has_match(t1, t2): 
for x, y in zip(t1, t2): 


If x == y: 
return True 
return False 


如 果 需 要 授 历 序列 中 的 元 到 以 及 它们 的 下 标 ， 可 以 使 用 内 置 画 数 


enumerate: 


for index, element in enumerate('abc'): 
print(index, element) 


这 个 枚 举 的 结果 是 一 个 枚 举 对 象 ， 这 个 对 象 送 代 一 个 对 序列 ， 在 
这 个 例子 中 ， 每 个 对 都 包含 一 个 下 标 《从 0 开始 ) 和 一 个 来 目 给 定 序列 
的 元 素 ， 输 出 结果 还 是: 


12.6 ”字典 和 元 组 


字典 有 一 个 items 方法 可 以 返回 一 个 元 组 的 序列 ， 其 中 每 个 元 组 
是 一 个 键 值 对 : 


{'a':O0, 'b': 
d.items() 


结果 是 一 个 dict_item 对 象 ， 它 是 一 个 迭代 稻 ， 可 以 欠 代 访问 
每 一 个 键 值 对 。 可 以 使 用 for 循环 来 访问 : 


>>> for key, value in d.items() 
print(key, value) 


和 预料 中 一 样 ， 字 典 中 的 项 是 没有 特定 顺序 的 。 


从 反方 回 出 发 ， 可 以 使 用 一 个 元 组 列表 来 初始 化 一 个 新 的 字典 : 


组 合 使 用 dict 和 zip 可 以 得 到 一 个 简洁 的 创建 字典 的 方法 : 


>>> d = dict(zip('abc', range(3))) 


字典 方法 update 也 接收 一 个 元 组 列表 ， 并 将 它们 作为 链 值 对 添 


加 到 一 个 已 有 的 字典 中 。 


使 用 元 组 作为 字典 的 键 很 常见 (主要 是 因为 不 能 使 用 列表 ) 。 例 
如 ， 一 个 电话 号 码 筹 可 能 需要 将 姓名 对 映射 到 电话 号 码 。 假 设 定义 了 
last ，first 和 number ， 可 以 这 么 写 : 


directory[last,first] = number 


在 方 括号 中 的 表达 式 是 一 个 元 组 。 我 们 也 可 以 使 用 元 组 赋值 来 遍 
历 这 个 字典 : 


for last, first in directory: 
print(first, last, directory[last,first]) 


这 个 循环 遍历 字典 directory 的 所 有 键 ， 它 们 都 是 元 组 。 它 将 
每 一 个 元 组 的 元 素 赋值 给 last 和 first ， 接 着 打印 出 名 字 以 及 对 应 
的 电话 号 码 。 


在 状态 图 中 有 两 种 方法 可 以 表达 元 组 。 更 详细 的 版 本 和 列表 一 
样 ， 显 示 索 引 和 元 素 。 例 如， 元 组 ('Cleese'，'John') 可 以 如 图 
12-1 所 示 。 


tuple 


0 一 = Cleese- 
1 一 > John 


图 12-1 状态 图 


但 是 在 更 大 的 图 中 你 可 能 希望 省 略 掉 细节 。 例 如 ， 整 个 电话 筹 的 
图 如 图 12-2 所 示 。 
dict 
(Cleese’, John’ 08700 100 222’ 
(Chapman’, ‘Graham’ ‘08700 100 222 
("ldle’, *Eric’) 一 > '08700 100 222° 


(Gilliam’, Terry) 一 = 08700 100 222° 
(Jones，Terry) 一 = 08700 100 222 
(‘Palin’, "Michael’) 一 = 08700 100 222 


图 12-2 ”状态 图 


这 里 元 组 使 用 Python 的 语法 作为 图 形 化 的 简写 展示 。 这 张 图 里 的 
电话 号 码 是 BBC 的 投诉 热线 ， 所 以 请 不 要 真 去 拨打 它 。 


12.7 序列 的 序列 


我 一 直 在 聚焦 于 元 组 的 列表 ,但 本 章 中 几乎 所 有 的 示例 都 可 以 对 
列表 的 列表 、 元 组 的 元 组 以 及 列表 的 元 组 使 用 。 为 了 避免 枚 举 所 有 的 
可 能 组 合 ， 有 时候 直接 说 序列 的 序列 更 简单 。 


在 很 多 环境 中 ， 不 同类 型 的 序列 (字符 串 、 列 表 和 元 组 ) 都 可 以 
互 换 使 用 。 应 当 如 何 选择 使 用 哪个 呢 ? 


从 最 明显 的 一 个 开始 ， 字 符 串 比 其 他 序列 有 更 多 限制 ， 因 为 它 的 
元 素 必 须 是 字符 。 它 们 也 是 不 可 变 的 。 如 采 你 需要 修改 一 个 字符 串 中 
的 字符 〈 而 不 是 新 建 一 个 字符 哩 ) ， 可 能 需要 使 用 字符 的 列表 。 


列表 比 元 组 更 加 通用 ， 主 要 因为 它 是 可 变 的 。 但 也 有 一 些 情况 下 
你 可 能 会 优先 选择 元 组 。 


1. 在 有 些 环境 中 ， 如 返回 语句 中 ， 创 建 元 组 比 创建 列表 从 语法 上 
说 更 容易 。 


2. 如 琳 需 要 用 序列 作为 字典 的 键 ， 则 必须 使 用 不 可 变 类 型 ， 如 元 
组 或 字符 串 。 


3， 如 采 你 要 癌 画 数 传 入 一 个 序列 作为 参数 ， 使 用 元 组 可 能 会 减少 
潜在 的 由 假名 导致 的 不 可 预知 行为 。 


因为 元 组 是 不 可 变 的 ， 它 们 不 提供 类 似 sort 和 reverse 之 类 的 
方法 ， 这 些 方法 修改 现 有 的 序列 。 但 Python 也 提供 了 内 置 函 数 sorted 
， 可 以 接收 任何 序列 作为 参数 ， 并 按 排 好 的 顺序 返回 带 有 同样 元 素 的 


新 列表 。Python 还 提供 了 reverse ， 可 以 接收 序列 作为 参数 ， 并 返回 
一 个 以 相反 顺序 遍历 列表 的 迭代 器 。 


12.8 ”调试 


列表 、 字 典 和 元 组 都 被 统一 看 作 是 一 种 数据 结构 。 本 章 中 我 们 开 
始 看 到 复合 数据 结构 ， 像 元 组 的 列表 ， 或 者 用 元 组 做 键 、 用 列表 做 值 
的 字典 等 。 复 合 数据 结构 很 有 用 ， 但 它 容易 导致 我 称 为 的 结构 错误 ; 
也 束 是 说 ， 数 据 结构 因为 错 的 类 型 、 大 小 或 结构 导致 的 错误 。 例 如 ， 
如 有 果 你 期 望 得 到 一 个 包含 单个 整数 的 列表 ， 而 我 给 你 一 个 单个 整数 
(而 不 是 在 列表 中 ) ， 就 会 出 错 。 


为 了 帮助 调试 这 种 问题 ， 我 写 了 一 个 模块 structshape ， 提 供 
一 个 也 叫 作 structshape 的 函数 ， 接 收 任何 数据 类 型 作为 参数 ， 并 
返回 一 个 描述 它 的 形状 的 字符 串 。 你 可 以 从 
http:/thinkpython2.comy/code/structshape.py 下 载 它 。 


下 面 是 一 个 简单 列表 的 结 采 : 


>>> from structshape import structshape 
>>> t = [1,2,3] 
>>> structshape(t) 


'Jist of 3 int' 


更 好 看 的 程序 可 能 会 输出 “ist of 3 ints”， 但 不 需要 人 处理 复数 更 加 
容易 。 下 面 是 列表 的 列表 : 


>>> t2 = [[1,2], [3,4], [5,6]] 
>>> structshape(t2) 


'Jist of 3 list of 2 int' 


如 果 列 表 的 元 素 不 是 同一 种 类 型 ，structshape 会 根据 它们 的 
类 型 按 顺 序 分 组 : 


>>> t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9] 
>>> structshape(t3) 


"ist of (3 int, float, 2 str, 2 list of int, int)' 


下 面 是 元 组 的 列表 : 


>>> S = 'abc' 

>>> lt = list(zip(t, s)) 

>>> structshape(1t) 

"List of 3 tuple of (int, str)' 


下 面 是 一 个 字典 ， 有 3 个 从 整数 映射 到 字符 串 的 项 : 


>>> d = dict(1t) 
>>> structshape(d) 


"dict of 3 int->str' 


如 果 你 发 现 要 记 住 数据 结构 有 困难 ，structshape 可 以 帮忙 。 


12.9 术语 表 


元 组 (tuple) : 一 个 不 可 变 的 元 素 序列 。 


元 组 赋值 \tuple assignment) : 一 个 赋值 语句 ， 右 侧 是 一 个 序 
列 ， 左 侧 是 一 个 变量 的 元 组 。 右 边 的 序列 会 被 求 值 ， 它 的 元 素 依 次 赋 
值 给 左 侧 元 组 中 的 变量 。 


收集 (gather) : 组 装 可 变 长 参数 元 组 的 操作 。 
分 散 (scatter) : 把 一 个 序列 当 作 参数 列表 的 操作 。 


zip 对 象 (zip object) : 调用 内 置 钞 数 zip 的 结果 ， 它 是 一 个 迭 
代 访 问 由 元 组 组 成 的 序列 的 对 象 。 


适 代 器 Miterator) : 可 以 遍历 序列 的 对 象 ， 但 它 不 提供 列表 的 操 
作 和 方法 。 


数据 结构 (data structure) : 相关 的 值 的 集合 ， 通 常 组 织 成 列 
表 、 字 典 、 元 组 等 。 


结构 错误 、(shape error) : 某 个 值 由 于 其 结构 不 对 导致 的 错误 ， 
即 它 的 类 型 或 尺寸 不 对 。 
12.10 ”练习 


练习 12-1 


编写 一 个 函数 most_frequent ， 接 收 一 个 字符 串 并 按照 频率 的 
降序 打印 字母 。 从 不 同 语言 中 查找 文本 样 例 并 查看 不 同 语言 中 的 单词 
频率 如 何 变 化 。 将 你 的 结果 和 
http://en.wikipedia.org/wiki/Letter_frequencies 上 的 列表 进行 对 比 。 


解答 : http://thinkpython2.com/code/most_frequent.py° 


练习 12-2 


更 多 回 文 ! 


1. 编写 一 个 程序 从 文件 中 读 入 一 个 单词 列表 《参见 9.1 节 ) 并 打 
印 出 所 有 有 是 回 文 的 单词 集合 。 


下 面 是 输出 的 样子 的 示例 : 


['deltas', 'desalt', "lasted'，'Salted'，'Slated'，'Sstaled '] 
['retainers', 'ternaries'] 
['generating', 'greatening'] 


['resmelts', 'smelters', 'termless'] 


提示 : 你 可 能 需要 构建 一 个 字典 将 字母 的 集合 映射 到 可 以 用 这 些 
字母 构成 的 单词 的 列表 上 。 问 题 是 ， 如 何 表 达 字 母 集合 ， 才 能 让 它 可 
以 用 作 字 典 的 键 ? 


2， 修改 前 一 个 问题 的 程序 ， 让 它 先 打印 最 大 的 回 文 列表 ， 再 打印 
第 二 大 的 回 文 列表 ， 依 次 类 推 。 


3. 在 Scrabble 拼 字 游 戏 中 ， 一 个 “bingo” 代 表 你 自己 架子 上 全 部 7 
个 字母 和 盘 上 的 一 个 字母 组 合成 一 个 8 字母 单词 。 哪 一 个 8 字母 单词 可 
以 生成 最 多 的 bingo? 提示 : 一 共有 7 个 。 


解答 : http://thinkpython2.com/code/anagram_sets.py ° 
练习 12-3 


两 个 单词 ， 如 果 可 以 通过 交换 两 个 字母 将 一 个 单词 转换 为 男 一 
个 ， 整 称 为 “置换 对 ”， 例 如 ，“converse”* 和 “conserve”。 编写 一 个 程序 


查找 字典 中 所 有 的 置换 对 。 提 示 : 不 要 测试 所 有 的 单词 对 ， 也 不 要 测 
试 所 有 可 能 的 交换 。 


解答 : http://thinkpython2.com/code/metathesis.py ° 
鸣谢 : 这 个 练习 启发 自 http://puzzlers.org 的 示例 。 


练习 12-4 


下 面 是 《车 迷 天 下 》》 节目 中 的 一 个 谜 题 
(http://www.cartalk.com/content/puzzlers ) : 


一 个 英文 单词 ， 当 逐个 删除 它 的 字母 时 ， 仍 然 是 英文 单词 。 这 样 
的 单词 中 最 长 的 是 什么 ? 


首 爷 ， 字 母 可 以 从 两 头 或 者 中 间 删 除 ， 但 你 不 能 重 排 字 母 。 每 次 
你 去 挥 一 个 字母 ， 则 得 到 男 一 个 英文 单词 。 如 采 一 直 这 么 做 ， 最 终 会 
得 到 一 个 字母 ， 它 本 身 也 是 一 个 英文 单词 一 一 可 以 从 字典 上 找到 的 。 
我 想 知道 这 样 的 最 长 的 单词 是 什么 ， 它 有 多 少 字 母 ? 


我 会 给 你 一 个 普通 的 例子 ，Sprite。 你 从 sprite 开 始 ， 取 出 一 个 字 
母 ， 从 单词 内 部 取 ， 取 走 r， 这 样 我 们 束 剩 下 单词 spite， 接 看 我 们 取 走 
结尾 的 e， 剩 下 spit， 接 着 取 走 s， 我 们 剩 下 pit it 和 IT。 


编写 一 个 程序 来 找到 所 有 可 以 这 样 缩减 的 单词 ， 然 后 找到 最 长 的 


一 个 。 


这 个 练习 比 大 部 分 练习 都 更 有 挑战 ， 所 以 下 面 有 一 些 建议 。 


1. 你 可 能 需要 编写 一 个 程序 接收 一 个 单词 ， 并 计算 出 所 有 通过 从 
它 取 出 一 个 字母 得 到 的 单词 的 列表 。 它 们 是 这 个 单词 的 “于” 单词。 


2， 递归 地 ， 只 有 当 一 个 单词 的 子 单词 中 有 一 个 可 缩减 时 ， 它 才 可 
缩减 。 作 为 一 个 基准 情形 ， 你 可 以 认为 空 字符 串 可 缩减 。 


3. 我 提供 的 单词 表 ，words ,txt ， 并 不 存在 单个 字母 的 单词 。 
所 以 你 可 能 需要 加 上 “I*、“a” 和 空 字 符 串 。 


4， 为 了 提高 程序 的 效率 ， 你 可 能 需要 记 住 已 知 的 可 缩减 的 单词 。 


解答 : http://thinkpython2.com/code/reducible.py ° 


第 13 章 ”案例 研究 : 选择 数据 结构 


到 这 里 你 应 该 已 经 学 会 了 Python 的 核心 数据 结构 ， 也 见 过 了 一 些 
使 用 它们 的 算法 。 如 果 你 想 要 更 多 地 了 解 算法 ， 可 以 阅读 第 21 章 。 但 
继续 下 面 的 内 容 之 前 那 部 分 内 容 并 不 是 必需 要 读 懂 ， 你 可 以 随感 兴趣 
时 时 去 阅读 。 


本 章 配 合 练习 介绍 一 个 案例 分 析 ， 帮 你 思考 如 何 选择 数据 结构 并 
如 何 实际 使 用 它们 。 


13.1 单词 频率 分 析 


和 前 面 的 章 和 一样， 应当 至 少 答 试 一 下 解决 问题 ， 再 看 我 的 解 


练习 13-1 


编写 一 个 程序 ， 读 入 一 个 文件 ， 将 每 行内 容 拆 解 为 单词 ， 璋 去 单 
词 周 围 的 空白 字符 和 标点 ， 并 转换 为 小 写 。 

提示 : string 模块 提供 了 空白 字符 串 whitespace ， 包 括 空 
格 、 制 表 符 、 换 行 符 等 ; 它 也 提供 了 punctuation ， 包 含 了 所 有 的 
标点 字符 。 让 我 们 试 试 能 不 能 让 Python 胡言 乱 语 : 


>>> import string 
>>> string.punctuation 


4S%& ()*+, /ii<=>?@[\]A{f1]-， 


另外 ， 也 可 以 考虑 字符 串 方 法 strip 、replace 和 translate 


练习 13-2 


去 往 古 腾 堡 工程 (Project Gutenberg,， http://www.gutenberg.org ) 
并 下 载 你 最 喜欢 的 无 版 权 书 籍 的 纯 文本 文档 。 


修改 前 一 个 练习 中 的 程序 ， 改 为 从 你 下 载 的 书籍 中 读 取 内 容 ， 跳 
过 文件 开头 的 信息 部 分 ， 并 和 前 面 一 样 将 文本 处 理 成 为 单词 。 


接着 修改 程序 ， 计 算 书 中 出 现 的 全 部 单词 的 总 数 ， 以 及 每 个 单词 
使 用 的 次 数 。 


打印 书 中 使 用 的 不 同 单词 的 个 数 。 比 较 不 同时 代 、 不 同 作者 的 不 
同 书 籍 。 哪 一 个 作者 使 用 的 词汇 最 广泛 ? 


练习 13-3 
修改 前 一 个 练习 中 的 程序 ， 计 算 书 中 使 用 频率 最 高 的 20 个 单词 。 


练习 13-4 


修改 前 面 的 程序 ， 读 入 一 个 单词 表 (参见 9.1 节 ) 并 打印 出 书 中 所 
有 不 在 单词 表 之 中 的 单词 。 这 其 中 有 多 少 是 拼写 错误 ?” 有 多 少 征 应 该 
出 现在 单词 表 中 的 常用 单词 ? 有 多 少 是 真正 冷 信 的 单词 ? 


13.2 ”随机 数 


给 定 相同 的 输入 ， 大 部 分 计算 机 程序 每 次 运行 都 会 生成 相同 的 输 
出 ， 所 以 它们 被 认为 是 有 确定 性 的 。 确 定性 通常 是 件 好 事 ， 因 为 我 们 
希望 相同 的 计算 能 有 相同 的 结果 。 但 对 某 些 特别 的 应 用 ， 我 们 希望 计 
算 机 是 不 可 预测 的 。 游 戏 是 一 个 明显 的 例子 ， 但 还 有 更 多 类 似 的 例 
学 


让 程序 变 得 真正 地 不 确定 很 难 ， 但 也 有 办 法 让 它 至 少 看 起 来 是 不 
确定 的 。 一 种 办 法 是 使 用 算法 来 生成 伪 随 机 数 。 仿 随机 数 并 不 是 真正 
随机 的 ， 因 为 它们 十 通 过 一 个 确定 性 的 算法 生成 的 ， 但 大 只 看 输出 的 
数字 的 话 ， 几 乎 不 可 能 看 出 来 和 随机 数 有 什么 区 别 。 


模块 random 提供 了 用 于 生成 伪 随 机 数 的 函数 〈 接 下 来 我 直接 简 
单 地 将 它 称 为 “随机 数 ”) 。 


函数 random 返回 一 个 从 0.0 到 1.0 之 间 的 随机 浮 点 数 (包括 0.0， 
但 不 包括 1.0) 。 每 当 调用 random 时 ， 会 得 到 一 个 很 长 的 随机 数 序列 
中 的 下 一 个 数 。 运 行 下 面 的 循环 ， 可 以 看 到 一 个 样本 : 


import random 


for i in range(10): 


x = random.random() 
print(x) 


函数 randint 接收 参数 low 和 high ， 并 返回 low 和 high 之 间 
(两 者 都 包含 ) 的 一 个 整数 。 


>>> random.randint(5, 10) 
5 
>>> random.randint(5, 10) 
9 


要 从 序列 中 随机 选择 一 个 元 素 ， 可 以 使 用 choice : 


>>> = [1, 2, 3] 
>>> random.choice(t) 
2 


>>> random.choice(t) 
3 


random 模块 还 提供 了 可 以 从 各 种 连续 分 布 序 列 中 生成 随机 数 的 
函数 ， 包 括 高 斯 分 布 、 指 数 分 布 、Y 分布 以 及 其 他 几 种 。 


练习 13-5 


编写 一 个 函数 choose_from_hist ， 接 收 一 个 11.1 节 所 定义 的 
直方 图 作为 参数 ， 并 从 这 个 直方 图 中 ， 按 照 频 率 的 大 小 ， 成 比例 地 随 
机 返回 一 个 值 。 例 如 ， 对 下 面 这 个 直方 图 : 
>>> t= ['a', 'a', 'b'] 


>>> hist = histogram(t) 
>>> hist 


{'a': 2, 'b': 1} 


你 的 函数 应 该 以 2/3 的 概率 返回 'a' ， 以 1/3 的 概率 返回 'b' 。 


13.3 ”单词 直方 图 


在 继续 阅读 之 前 你 应 当 答 试 前 面 的 练习 。 你 可 以 从 
http://thinkpython2.com/code/ analyze_book1.py 下 载 我 的 解答 。 你 还 需 
要 http://thinkpython2.com/code/emma.txt 。 


下 面 是 一 个 读 取 文 件 并 从 文件 中 的 单词 构造 直方 图 的 例子 : 


import string 


def process_file(filename ) : 
hist = dict() 
fp = open(filename) 
for line in fp: 
process_ line(line, hist) 
return hist 


def process_line(line, hist): 
line = line.replace('-', ' ') 
for word in line.split(): 
word = word.strip(string.punctuation + string.whitespace) 
word = word.lower() 


hist[word] = hist.get(word, 0) + 1 


hist = process file('emma.txt') 


这 个 程序 读 入 emma .txt ， 其 内 容 是 简 : 奥 斯 丁 的 《 爱 玛 》 的 文 
大 


process_file 循环 遍历 文件 中 的 每 一 行 ， 每 次 将 一 行 传递 给 
process_line 画 数 。 直 方 图 hist 用 作 连 加 絮 。 


process_line 使 用 字符 串 方 法 replace 将 '-' 符号 替换 为 空 
格 ， 再 使 用 split 将 各 行文 本 拆 分 成 一 个 字符 串 列 表 。 它 所 历 单 词 列 
表 ， 使 用 strip 和 1Lower 去 除 掉 标 点 符号 并 转换 为 小 写 。 (我 们 


说 “转换 "， 只 是 个 人 简称， 记 住 字符 串 有 古 不 可 变 的 ， 所 以 strip 和 
lower 这 样 的 方法 返回 的 是 新 字符 串 。) 


最 后 ，process_line 通过 创建 靳 项 或 者 增加 旧 有 项 的 值 来 更 新 
直方 图 。 


要 计算 文件 中 单词 的 总 数 ， 我 们 可 以 素 加 直方 匈 中 的 频率 


def total words(hist): 
return sum(hist.values()) 


不 同 单词 的 个 数 ， 束 是 字典 里 的 元 陛 数 量 : 


def different_words(hist): 
return len(hist) 


下 面 是 打印 结果 的 代码 : 


print(' Total number of words:', total words(hist)) 
print('Number of different words:', different_words(hist)) 


以 及 结 末 : 


Total number of words: 161080 
Number of different words: 7214 


13.4 最 常用 的 单词 


要 寻找 最 常用 单词 ， 我 们 可 以 生成 一 个 元 组 的 列表 ， 其 中 每 个 元 
组 包括 一 个 单词 及 其 频率 ， 并 对 其 进行 排序 。 


下 面 的 函数 接收 一 个 直方 图 ， 并 返回 “单词 -频率 ”元 组 的 列表 : 


def most_common(hist): 


for key, value in hist.items(): 
t.append( (value, key)) 


t.sort(reverse=True) 
return t 


在 每 个 元 组 中 ， 频 率先 出 现 ， 所 以 结果 列表 按 频 率 排序 。 下 面 的 
循环 打印 出 最 单 用 的 10 个 单词 : 


t = most_common(hist ) 

print(' The most common words are:') 

for freq, word in t[:10]: 
print(word, freq, sep="'\t'"') 


这 里 我 使 用 关键 字 参 数 sep 通知 print 去 使 用 制 表 符 作 为 分 隔 
符 ， 而 不 使 用 空格 。 于 是 第 二 列 可 以 对 其 排列 。 下 面 是 《 爱 玛 》 的 结 


The most common words are: 
5242 
5205 
4897 
4295 
3191 


3130 
2529 
2483 
2400 
2364 


这 段 代码 可 以 用 sort 画 数 的 key 参数 进行 简化 。 如 果 你 有 兴 
趣 ， 可 以 读 一 下 相关 的 文章 : 
http://wiki.python.org/moin/HowTo/Sorting ° 


13.5 ”可 选 形 参 


我 们 已 经 见 过 一 些 接收 可 选 形 参 的 内 置 画 数 和 方法 。 用 户 也 可 以 
编写 接收 可 选 形 参 的 目 定义 函数 。 例 如 ， 下 面 的 函数 打印 一 个 直方 多 
中 最 第 见 的 单词 : 


def print_most_common(hist, num=10): 
t = most_common(hist) 
print('The most common words are:') 


for freq, word in t[:num]: 
print(word, freq, sep="'\t') 


第 一 个 形 参 是 必需 的 ; 第 二 个 是 可 选 的 。 形 参 num 的 默认 值 是 
10。 


如 果 只 提供 一 个 实 参 : 


print_most_common(hist) 


num 会 获得 默认 值 。 如 有 果 提 供 两 个 实 参 : 


print_most_common(hist, 20) 


num 则 会 获得 所 提供 的 实 参 值 。 换 句 话 说 ， 可 选 实 参 值 履 盖 默认 


如 果 一 个 函数 既 有 必需 形 参 ， 也 有 可 选 形 参 ， 则 所 有 的 必需 形 参 
都 必须 在 前 面 ， 后 面 跟着 可 选 形 参 。 


13.6 ”字典 减法 


寻找 在 书 中 出 现 却 不 在 words ,txt 单词 表 中 的 单词 ， 这 个 问题 
可 以 看 作 是 集合 减法 ， 也 就 古 说 ， 我 们 想 要 找到 出 现在 一 个 集合 ( 书 
中 的 单词 ) 而 不 在 男 一 个 集合 (单词 表 中 的 单词 ) 的 所 有 单词 。 


subtract 函数 接收 两 个 字典 d1 和 d2 ， 并 返回 一 个 新 的 字典 ， 
包含 所 有 出 现在 d1 中 且 不 出 现在 d2 中 的 键 值 。 由 于 我 们 并 不 真 的 关 
心 字 典 的 值 ， 我 们 将 所 有 值 都 设 为 None 。 


def subtract(di, d2): 
res = dict() 
for key in di1: 


If key not in d2: 
res[key] = None 
return res 


要 找 出 书 中 出 现 而 不 在 words .txt 单词 表 中 的 词 ， 我 们 可 以 使 
用 process_file 为 words ,txt 建立 一 个 直方 图 ， 再 使 用 减法 : 


words = process_ file('words.txt') 
diff = subtract(hist, words) 


print("Words in the book that aren't in the word list:") 


for word in diff: 
print(word, end=' ') 


下 面 征 《 爱 玛 》 一 书 中 的 部 分 结果: 


Words in the book that aren't in the word list: 
rencontre jane's blanche woodhouses disingenuousness 


friend's venice apartment ... 


这 些 词 中 有 些 是 名 字 或 所 有 格 单词 。 其 他 的 ， 如 “rencontre”， 已 
经 不 再 常用 。 但 也 有 一 些 是 真 应 该 包含 在 单词 表 中 的 ! 
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Python 提供 了 一 个 数据 结构 set ， 它 提供 了 很 多 常见 的 集合 操 
作 。 你 可 以 读 19.5 市 中 关于 集合 操作 的 内 容 ， 或 者 阅读 
http://docs.python. org/3/library/stdtypes.html#types-set 上 的 文档 ， 并 编写 
一 个 程序 使 用 集合 减法 来 寻找 出 现在 书 中 但 不 出 现在 单词 表 中 的 单 
词 。 解 答 : http://thinkpython2.com/code/ analyze_book2.py。 


13.7 ”随机 单词 


大 要 从 直方 图 中 随机 选择 一 个 单词 ， 最 简单 的 算法 是 根据 计算 得 
到 的 频率 构建 一 个 列表 ， 其 中 每 个 单词 根据 词 频 有 多 个 拷贝 ， 并 从 中 
随机 选择 一 个 单词 : 


def random word(h): 
t = [ 
for word, freq in h.items(): 


t.extend([word] * fred) 


return random.choice(t) 


表达 式 [word] * freq 创建 一 个 列表 ， 里 面 有 单词 word 的 
fred 个 副本 。extend 方法 和 append 类 似 ， 区 别 是 接收 的 参数 是 一 


个 序列 。 


这 个 算法 可 以 使 用 ， 但 效率 并 不 高 ; 每 当选 择 一 个 随机 单词 时 ， 
它 会 重建 列表 ， 而 这 个 列表 和 原 书 差不多 长 。 一 个 明显 的 改进 方法 是 
只 建立 列表 一 次 ， 再 使 用 多 次 选择 ， 但 这 么 做 列表 仍然 很 大 。 


更 好 的 蔡 代 方案 如 下 。 
1. 使 用 keys 来 获得 书 中 所 有 的 单词 的 列表 。 


2. 构建 一 个 列表 ， 包 含 单词 频率 的 累积 和 (参见 练习 10-2) 。 这 
个 列表 中 的 最 后 一 项 是 书 中 单词 的 总 数 mn 。 


3. 在 1 到 nm 之 间 随 机 选择 一 个 数 。 使 用 二 分 查找 (参见 练习 10- 
11) 来 找到 随机 数 在 累积 和 列表 中 应 该 出 现 的 位 置 的 下 标 。 


4. 使 用 这 个 下 标 ， 在 单词 表 中 找到 相应 的 单词 。 
练习 13-7 


编写 一 个 程序 ， 使 用 这 个 算法 来 从 书 中 选择 一 个 随机 的 单词 。 


解答 : http://thinkpython2.com/code/analyze_book3.py 。 


13.8 ”马尔 可 夫 分 析 


如 果 你 从 书 中 随机 地 获取 单词 ， 可 以 借 此 感受 一 下 书 中 的 词汇 ， 
但 可 能 无 法 通过 随机 获取 来 得 到 一 句 话 : 


this the small regard harriet which knightley's it most things 


一 个 随机 单词 的 序列 ， 很 难 组 成 有 意义 的 话 ， 因 为 相 邻 的 词 之 间 
没有 任何 关联 。 例 如 ， 在 一 个 真实 的 句子 中 ， 冠 词 “the” 应 当 会 后 接 一 
个 形容 词 或 名 词 ， 而 不 应 是 动词 或 副词 。 


测量 这 种 类 型 的 关联 的 方法 之 一 是 使 用 马尔 可 夫 分 析 ， 它 能 够 用 
于 摘 述 给 定 的 单词 序列 中 下 一 个 可 能 出 现 的 单词 的 概率 。 例 如 ， 歌 曲 
《Eric，the Half a Bee》 的 开头 是 : 


Half a bee, philosophically, 
Must, ipso facto, half not be. 
But half the bee has got to be 
Vis a vis, its entity. D’you see? 
But can a bee be said to be 

Or not to be an entire bee 
When half the bee is not a bee 


Due to some ancient injury? 


在 这 上 段 文 本 中 ， 短 语 “half the” 总 是 后 接着 单词 "bee”， 但 短语 “the 
bee” 则 可 能 后 接 “has” 或 “is” Go 


马尔 可 夫 分 析 的 结果 是 一 个 从 每 个 前 级 (如 “half the”* 和 “the 
bee”) 到 其 所 有 可 能 后 缀 〈 如 “has” 和 ”is”) 的 映射 。 


给 定 这 种 映射 后 ， 你 束 可 以 用 它 来 生成 随机 文本 。 从 任意 前 绥 开 
始 ， 并 从 它 的 可 能 后 级 中 随机 选择 一 个 。 接 着 ， 你 可 以 将 前 缀 的 结尾 
和 后 缀 组 合 起 来 ， 作 为 下 一 个 前 级 ， 并 继续 重复 。 


例如 ， 如 采 你 以 前 组 “Half a* 开 始 ， 则 接 下 来 一 个 单词 必 害 
是 “bee”， 因 为 这 个 前 级 在 文本 中 只 出 现 了 一 次 。 下 一 个 前 弘 是 “a 
bee”， 所 以 下 一 个 后 级 可 能 是 “philosophically”be” 或 者 “due”。 


在 这 个 例子 中 前 缀 的 长 度 总 古 2， 但 其 实 你 可 以 使 用 任意 前 缀 长 度 
来 进行 马尔 可 夫 分 析 。 


练习 13-8 


马尔 可 夫 分 析 : 


1. 编写 一 个 程序 从 文件 中 读 入 文本 ， 并 进行 马尔 可 夫 分 析 。 结 果 
应 该 吓 一 个 字典 ， 将 前 缀 映 喘 到 可 能 后 缀 的 集合 。 和 集合 可 以 古 列表 、 
元 组 或 者 字典 ， 由 你 来 做 出 合适 的 选择 。 你 可 以 使 用 前 缀 长 度 2 来 测试 
程序 ， 但 编写 程序 时 应 当 考 虚 可 以 方便 地 改 为 其 他 前 级 长 度 。 


2. 在 前 面 编写 的 程序 中 添加 一 个 函数 ， 基 于 马尔 可 夫 分 析 的 结 
随机 生成 文本 。 下 面 是 一 个 从 《 爱 玛 》 中 使 用 前 绥 长 度 2 生 成 的 例 于 : 


He was very clever, be it Sweetness or be angry, ashamed or only 


amused, at Such a stroke. She had never thought of Hannah till you were 


never meant for me?” “I cannot make speeches, Emma:” he soon cut it all 


himself. 


对 这 个 例子 ,我 留 下 了 每 个 单词 后 面 的 标点 。 结 果 几 乎 是 语法 正 
确 的 ， 但 也 不 完全 对 。 语 义 上 ， 它 看 起 来 很 像 是 有 意义 的 ， 但 也 不 完 


全 十 。 


当 增加 前 缘 长 度 时 ， 结 果 会 怎么 样 ? 随机 生成 的 文本 会 不 会 看 来 
更 有 意义 ? 


3. 一 旦 你 的 程序 可 以 正常 运行 后 ， 可 以 考虑 笠 试 一 下 混搭 : 如 采 
对 两 本 或 更 多 本 书 进行 组 合 ， 则 生成 的 随机 文本 会 以 一 种 有 趣 的 方式 
混合 各 书 中 的 词汇 和 短语 。 


致谢 : 本 案例 分 析 基 于 Kernighan 和 Pike 的 The Practice of 
Programming (Addison-Wesley, 1999) 一 书 中 的 一 个 示例 。 


你 应 当 在 继续 阅读 前 尝试 这 个 练习 3， 接着 可 从 
http://thinkpython2.com/code/ markov.py 下 载 我 的 解答 。 你 也 需要 
http://thinkpython2.com/code/emma.txt ° 


13.9 ”数据 结构 


使 用 马尔 可 夫 分 析 生 成 随机 文本 很 有 趣 ， 但 这 个 练习 还 有 一 个 要 
点 : 数据 结构 的 选择 。 在 前 面 的 练习 中 ， 你 需要 选择 : 


。 如 何 表达 前 绥 ; 
。 如 何 表达 可 能 的 后 绥 的 集合 ; 


。 如 何 表 达 每 个 前 绥 到 可 能 后 绥 的 集合 的 映射 。 


最 后 一 个 选择 很 滑 单 ， 要 从 键 映 射 到 对 应 的 值 ， 字 典 是 最 目 然 的 
选择 。 

对 前 缀 来 说 ， 最 明显 的 迁 择 是 字符 串 、 了 字符 串 列表 或 者 字符 串 元 
组 。 对 后 级 来 说 ， 一 种 选择 是 列表 ， 男 一 种 是 直方 图 (字典 ) 。 


你 会 如 何 选 择 ? 第 一 步 需 要 思考 每 种 数据 结构 需要 实现 的 操作 。 
对 前 级 而 言 ， 我 们 需要 能 够 从 前 方 删除 一 个 单词 ， 并 在 后 方 添加 一 个 
单词 。 例 如 ， 如 果 当 前 的 前 级 是 “Half a*， 而 下 一 个 单词 是 “bee”»， 则 
需要 能 够 构造 下 一 个 前 缀 ,，“abee”。 


你 的 第 一 个 选择 可 能 钙 列 表 ， 因 为 列表 添加 和 删除 元 素 都 很 方 
便 。 但 我 们 也 需要 使 用 前 缀 作为 字典 的 键 ， 所 以 列表 被 排除 掉 。 对 元 
组 而 言 ， 虽然 你 不 能 附加 或 删除 ， 但 可 以 使 用 加 法 操作 符 来 构建 一 个 
新 的 元 组 : 


def shift(prefix, word): 
return prefix[1:] + (word,) 


shift 接收 一 个 单词 的 元 组 、prefix ， 以 及 一 个 字符 串 word 
， 并 构建 一 个 新 的 元 组 ， 包 含 prefix 中 除了 第 一 个 之 外 的 元 素 ， 并 
把 word 添加 在 最 后 。 


对 后 绥 集 合 而 言 ， 我 们 需要 进行 的 操作 包括 添加 一 个 新 的 后 绥 
(或 者 增加 一 个 已 有 后 缀 的 频率 ) ， 以 及 随机 选择 一 个 后 级 。 


添加 一 个 新 后 级 ， 使 用 列表 实现 或 者 直方 图 实现 效率 上 相同 。 从 
一 个 列表 中 随机 选择 元 素 很 简单 ;从 直方 图 中 随机 选择 则 更 难 一 些 
(参见 练习 13-7) 。 


到 此 为 止 我 们 一 直 在 讨论 实现 的 简易 性 ， 但 选择 数据 结构 时 ， 还 
有 其 他 需要 考虑 的 因素 。 一 个 是 运行 时 间 。 有 时 候 ， 我 们 可 以 从 理论 
上 预期 一 种 数据 结构 比 另 一 种 更 快 ， 例 如， 我 所 到 过 in 操作 符 ， 当 元 
素数 量 很 大 时 ， 在 字典 中 使 用 比 在 列表 中 快 。 


但 哪 种 实现 会 更 快 第 党 无 法 事先 预知 。 一 个 办 法 是 两 种 都 实现 ， 
再 比较 哪个 更 快 。 这 种 方法 称 为 基准 比较 (benchmarking) 。 比较 实 
际 的 方案 是 先 选择 最 容易 实现 的 数据 结构 ， 然 后 看 它 是 否 对 预期 的 程 
序 而 言 足够 快 。 如 有 果 已 经 足够 ， 则 不 需要 变动 ; 否则 ， 可 以 使 用 
profile 模块 之 类 的 工具 ， 发 现 程序 中 哪些 地 方 占 用 了 最 长 的 时 间 。 


男 一 个 考虑 因素 钙 存 储 空间 。 例 如 ， 使 用 直方 图 来 保存 后 级 集合 
可 能 占用 较 少 空间 ， 因 为 不 论 一 个 单词 在 文本 中 出 现 多 少 次 ， 你 只 需 
要 你 存 一 次 。 有 的 情况 下 ， 市 省 空间 也 可 以 让 你 的 程序 运行 更 快 ， 而 
在 极端 的 情形 中 ， 如 末 导 致 内 存 盗 出 ， 则 程序 无 法 正 第 运行 。 但 对 大 
多 数 程序 来 说 ， 存 储 空间 是 次 于 运行 速度 的 第 二 考虑 因素 。 


最 后 一 点 : 在 这 个 讨论 中 ， 对 于 分 析 和 生成 两 个 过 程 ， 我 暗示 了 
我 们 应 当 使 用 相同 的 数据 结构 。 但 因为 这 是 两 个 分 开 的 阶段 ， 所 以 也 
可 以 在 分 析 阶 段 使 用 一 种 数据 结构 ， 再 转换 为 刃 一 种 数据 结构 用 于 生 
成 阶段 。 如 末 新 的 数据 结构 在 生成 阶段 节省 的 时 间 大 于 转换 花费 的 时 
间 ， 则 总 的 来 说 是 有 利 的 。 


13.10 ”调试 


当 在 调试 程序 时 ， 尤 其 古 对 付 一 个 困难 的 bug 时 ， 可 以 笑 试 下 面 5 
局 


阅读 


审阅 你 的 代码 ， 对 目 己 读 出 来 ， 并 检查 它 是 否 和 你 想 说 的 一 致 。 


\ 一 


et 


做 一 些小 修改 并 进行 试验 ， 或 者 运行 不 同 的 版 本 。 通 肖 如 果 在 程 
序 中 正确 的 地 方 加 上 正确 的 输出 ， 问 题 整 会 变 得 更 加 显而易见 。 但 有 
时 候 你 需要 构建 一 个 脚手架 。 


沉思 


化 些 时 间 思 考 ! 可 能 是 哪 种 类 型 的 错误 : 语法 的 、 运 行 时 的 还 是 
语义 的 ? 从 错误 消息 或 程序 输出 中 可 以 得 到 什么 信息 ? 哪 种 错误 可 能 
导致 你 看 到 的 问题 ? 在 问题 出 现 之 前 ， 你 的 最 后 一 次 修改 是 什么 ? 


橡皮 鸭 调 试 


如 采 你 癌 其 他 人 解释 遇 到 的 问题 ， 有 时 候 能 在 说 完 问 题 之 前 隋 找 
到 答案 。 通 党 你 甚至 不 需要 找 人 去 诉说 ， 而 只 需要 对 橡皮 了 鸭 诉 说 即 


可 。 这 就 是 著名 的 橡皮 鸭 调 试 (rubber duck debugging) 的 来 源 。 这 可 
不 是 我 编 出 来 的 ， 参 见 https:/en wikipedia.org/wiki/ 
Rubber duck debugging。 


回 退 
在 某 种 情况 下 ， 最 好 的 办 法 束 是 回 退 ， 撤 销 最 近 的 修改 ， 直 到 你 


的 程序 恢复 到 之 前 没有 错误 且 能 够 理解 的 程度 。 然 后 可 以 开始 重新 构 
建 。 


新 手 程序 员 有 时 会 卡 在 这 些 环节 中 的 某 一 个 上 ， 却 起 了 还 可 以 竹 
试 其 他 的 环节 。 每 个 环节 都 有 其 独 目 的 失败 模式 。 


例如 ， 当 问题 是 一 个 拼写 错误 时 ， 阅 读 代码 可 以 帮忙 ， 但 看 问题 
征 概 念 误 解 导 致 ， 束 没有 效果 了 “。 如 采 你 不 理解 目 己 的 程序 ， 那 么 即 
使 阅读 100 迄 ， 也 发 现 不 了 问题 ， 因 为 错误 是 在 你 大 脑 中 的 。 


运行 一 些 试验 代 码 可 以 起 到 很 大 帮助 ， 尤 其 是 那些 短小 而 简单 的 
测 弃 程 序 。 但 如 条 你 没有 思考 或 阅读 代码 束 运 行 坛 验 代 码 ， 则 可 能 会 
陷入 我 称 之 为 “随机 走动 编程 ”的 模式 之 中 。 即 蝇 无 目标 地 随机 改变 程 
序 ， 直 到 程序 正确 运行 为 目 。 受 无 锋 问 ， 随 机 走动 编程 可 能 要 人 费 很 
长 的 时 间 。 


你 必需 花 一 定 的 时 间 去 思考 。 调 斌 就 像 是 一 门 实验 科学 。 你 应 当 
至 少 有 一 个 关于 这 个 问题 的 假设 。 如果 有 两 个 以 上 的 可 能 性 ， 可 以 试 
着 构思 一 个 测试 来 排除 其 中 一 个 。 


但 如 采 有 太 多 错误 ， 或 者 你 要 修正 的 代码 太 大 太 复 杂 ， 即 使 最 好 
的 调试 技巧 也 会 失败 。 有 时 候 最 好 的 选择 是 回 退 ， 简 化 程序 ， 直 到 得 
到 一 个 你 能 够 理解 并 且 正 确 运 行 的 程序 。 


新 手 程序 员 往 往 不 愿意 后 撤 ， 他 们 无 法 忍受 删除 一 行 代 码 (即使 
那 是 错误 的 代码 ) 。 如 有 果 能 让 你 感觉 更 好 ， 可 以 将 程序 复制 到 另外 一 
个 文件 再 开始 删 减 它 。 这 样 以 后 束 可 以 一 点 一 点 地 复制 回来 。 


寻找 一 个 困难 的 bug， 需 要 了 阅读、 运行 、 沉 思 ， 甚 至 有 时 候 需 要 回 
退 。 如 果 你 在 这 其 中 一 个 环节 上 卡 住 了 ， 可 以 竹 试 其 他 的 环 订 。 


13.11 术语 表 


确定 性 《deterministic) : 程序 的 一 种 特性 : 给 定 相同 的 输入 ， 
次 运行 都 会 执行 相同 的 操作 。 


伪 随 机 (pseudorandom) : 一 序列 数 : 看 起 来 是 随机 的 ， 但 实际 
上 是 由 市 着 确定 性 的 程序 生成 的 。 


默认 值 (default value) : 可 选 形 参 声明 时 给 定 的 值 ， 如 果 函 数 调 
用 时 没有 指定 这 个 实 参 的 值 ， 则 使 用 该 默认 值 。 


窗 盖 (override) : 使 用 实 参 值 奉 换 一 个 默认 值 。 


基准 测试 (benchmarking) : 实现 不 同 的 备 选 方案 ， 并 使 用 各 种 
可 能 输入 的 样本 来 测试 它们 ， 以 达到 选择 使 用 哪 种 数据 结构 的 目的 。 


橡皮 鸭 调 试 (rubber duck debugging) : 通过 向 类 似 橡皮 鸭 之 类 的 
静物 解释 你 的 问题 ， 进 行 调试 的 过 程 。 虽 然 橡 皮 鸭 不 懂 python， 但 通 
过 诉说 和 解释 ， 可 以 帮助 你 解决 问题 。 

13.12 ”练习 
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一 个 单词 的 "排名 ”和 是 它 在 单词 列表 中 按 频 率 排 序 的 位 置 : 最 前 见 
的 词 排名 第 1， 次 常用 的 词 排 第 -， 等 等 。 


齐 普 夫 定律 (Zipf’s law) 描述 了 排名 和 自然 语言 中 词 频 的 关系 
(http://en.wikipedia.org/ wiki/Zipfs_law) 。 特 别 地 ， 它 预测 了 排名 为 r 
的 单词 的 频率 f: 


f=cr 


这 里 s 和 c 是 依赖 于 语言 和 文本 的 参数 。 如 果 在 表达 式 两 侧 都 调用 
对 数 ， 则 得 到 |: 


logf=logc—slogr 


所 以 如 果 以 logr 为 横 轴 给 log j 绘图， 则 会 得 到 斜率 为 -=s ， 截 距 为 
logc 的 直线 。 


编写 一 个 程序 ， 从 文件 中 读 入 文本 ， 计 算 单 词 词 频 ， 并 按照 词 频 
的 降序 ， 每 一 行 打印 出 一 个 单词 ， 以 及 log f 和 log r。 使 用 你 喜欢 的 制 


图 程序 将 结 采 以 图 表 形式 展现 出 来 ， 并 检查 它 是 否 为 直线 。 你 能 估计 s 
的 值 吗 ? 

解答 : http://thinkpython2.com/code/zipf.py。 要 运行 我 的 解答 ， 你 
需要 安 泌 绘图 模块 matplot1lib。 如 果 安 普 过 Anaconda， 你 束 已 经 有 
了 matplotlib ， 否 则 你 可 能 需要 安 闭 它 。 


第 14 章 文件 


本 章 介 绍 “ 持 久 ” 程 序 的 概念 ， 它 们 将 数据 存储 到 持久 存储 中 。 男 
外 ， 我 们 还 会 看 到 不 同 种 类 的 持久 存储 ， 如 文件 和 数据 库 。 


14.1 持久 化 
我 们 现在 见 过 的 程序 都 是 瞬 态 的 ， 因 为 它们 会 在 短暂 的 时 间 里 运 


行 出 一 些 输出 ， 但 当 运 行 结束 后 ， 它 们 的 数据 会 消失 。 如 采 再 次 运行 
程序 ， 它 会 再 次 全 新 地 开始 。 


也 有 些 程序 是 持久 化 的 :它们 会 运行 很 长 一 段 时 间 《或 者 一 直 运 
行 ) ; 它们 会 至 少 存储 一 部 分 数据 到 永久 存储 例如， 硬盘， 中 ;而 
且 如 采 它 们 被 关闭 重 司 后 ， 会 接着 从 上 次 离开 的 状态 继续 。 


持久 化 程序 的 例子 包括 操作 系统 ， 它 几乎 运行 在 任何 一 台 开 局 的 
电脑 中 ， 以 及 web 服 务 历 ， 它 们 通 单 持续 运行 ， 等 竺 网 络 上 连 入 的 请 
3 


读 写 文本 文件 是 程序 维护 数据 最 简单 的 方法 之 一 。 我 们 已 经 见 过 
读 取 文本 文件 的 程序 ， 在 本 章 中 将 会 见 到 往 文件 写 入 的 程序 。 


另 一 种 办 法 是 将 程序 的 状态 保存 到 数据 库 中 。 本 章 中 我 们 会 介绍 
一 个 简单 的 数据 库 ， 以 及 一 个 模块 ，pickle ， 用 来 简化 程序 数据 的 
存储 。 


14.2” 读 和 写 


文本 文件 是 存储 在 诸如 硬盘 、 内 存 或 光盘 的 永久 媒介 上 的 字符 串 
序列 。 我 们 已 经 在 9.1 市 中 见 过 如 何 打开 和 读 取 一 个 文件 。 


要 写 入 一 个 文件 ， 需 要 使 用 'w' 模式 作为 第 二 个 实 参 来 打开 它 : 


>>> fout = open('output.txt', 'w') 


如 条文 件 已 经 存在 ， 则 使 用 写 模式 打开 时 会 清除 掉 旧 有 数据 并 重 
新 开始 ， 所 以 请 谍 慎 ! 如 有 果 文 件 不 存在 ， 则 会 新 建 一 个 。 


open 函数 返回 一 个 文件 对 象 ， 提 供 操作 文件 的 方法 。 其 中 
write 方法 把 数据 写 入 到 文件 中 。 


>>> line1 = "This here's the wattle,\n" 
>>> fout .write(line1) 


24 


返回 值 是 写 入 的 字符 数目 。 文 件 对 象 会 记录 写 到 了 哪里 ， 所 以 如 
果 你 再 次 调用 write ， 它 会 在 文件 的 结尾 处 添加 新 的 数据 。 


>>> line2 = "the emblem of our land.\n" 
>>> fout .write(line2) 
24 


当 写 入 完毕 时 ， 应 该 关闭 文件 。 


>>> fout.close() 


如 果 不 关闭 文件 ， 程 序 会 在 执行 结束 时 将 文件 关闭 。 
14.3 ”格式 操作 符 


write 的 参数 必须 是 字符 串 ， 所 以 大 我 们 想 要 往 文 件 中 写 入 其 他 
类 型 的 值 ， 必 须 将 它们 先 转换 为 字符 串 。 最 容易 的 办 法 是 使 用 str : 


>>> x = 52 
>>> fout .write(str(x)) 


另 一 个 办 法 是 使 用 格式 操作 符 %。 当 用 于 整数 时 ，% 是 求 余 操 作 
符 。 但 车 第 一 个 操作 对 象 是 字符 串 时 ，% 则 是 格式 操作 符 。 

% 的 第 一 个 操作 对 象 是 格式 字符 串 ， 包 括 了 一 个 或 多 个 格式 序列 
， 由 它们 来 指定 第 二 个 操作 对 象 如 何 格式 化 。 表 达 式 的 结果 是 一 个 字 
答 串 。 

例如 ， 格 式 序列 '%d' 意味 着 第 二 个 操作 数 应 该 被 格式 化 为 十 进 
制 整数 。 


>>> camels = 42 
>>> '%d' % camels 
1'427 


结果 是 字符 串 '42' ， 请 不 要 将 它 和 整数 值 42 混 淆 。 


格式 序列 可 以 出 现在 字符 串 的 任意 地 方 ， 所 以 可 以 在 一 个 句子 中 
舱 入 变量 值 : 


>>> 'I have Spotted %d camels.' % camels 
'I have Spotted 42 camelSs, 


如 宋 字 符 串 中 有 多 于 一 个 格式 序列 ， 第 二 个 操作 对 象 殉 必 须 十 元 
组 。 每 个 格式 序列 按 顺 序 对 应 元 组 中 的 一 个 元 素 。 


下 面 的 例子 使 用 '%d ' 格式 化 整数 ，'%g' 格式 化 浮 点 数 ， 以 
及 '%s' 格式 化 字符 串 : 


>>> "In %d years I have Spotted %g %s.' % (3, 0.1, 'camels') 
"In 3 years I have spotted 0.1 camels.' 


元 组 中 元 素 的 个 数 必 须 和 字符 串 中 格式 序列 的 个 数 一 致 。 另 外 ， 
元 素 的 类 型 也 要 和 格式 序列 一 致 ; 
>>> '%d %d %d' % (1, 2) 


TypeError: not enough arguments for format string 
>>> '%d' % 'dollars' 


TypeError: %d format: a number is required, not str 


第 一 个 例子 中 ， 元 组 中 元 素 个 数 不 够 ， 第 二 个 例子 中 ， 元 素 的 类 
型 不 对 。 

更 多 关于 格式 操作 符 的 信息 参见 
https://docs.python.org/3/library/stdtypes.html#printf-style- string- 
formatting。 还 有 一 个 更 强大 的 玲 代 方案 是 字符 串 格 式 方法 ， 参 见 
https://docs.python.org/3/library/stdtypes.html#str.format ° 


14.4 文件 名 和 路 径 


文件 组 织 在 目录 〈 也 称 为 文件 夹 ) 中。 每 个 程序 都 有 “当前 目 
录 ”， 它 是 大 多 数 操 作 的 默认 目录 。 例 如 ， 当 打开 一 个 文件 用 于 读 取 
时 ，Python 默 认 在 当前 目录 寻找 它 。 


os 模块 提供 了 用 于 操作 文件 和 目录 的 函数 (os 代表 operating 
system， 即 操作 系统 ) 。os .getcwd 返回 当前 目录 的 名 称 : 


>>> import os 


>>> cwd = os.getcwd() 
>>> cwd 
'/home/dinsdale' 


cwd 表示 current working directory 〈 即 “当前 工作 目录 ”) 。 这 个 例 
子 里 的 结果 是 /home/dinsdale ， 是 名 为 dinsdale 的 用 户 的 主 目 
录 。 


类 似 于 '/home/dinsdale' 这 样 用 来 定位 一 个 文件 或 目 孙 的 字 
符 串 被 称 为 一 个 路 径 (path) 。 


而 一 个 简单 文件 和 名， 如 memo .txt ， 也 被 认为 是 一 个 路 径 ， 但 它 
是 一 个 相对 路 径 ， 因 为 它 依赖 于 当前 目 了 未 。 如 果 当 前 目录 
是 /home/dinsdale ， 则 文件 名 memo .txt 指 的 
是 


/home/dinsdale/memo.txt 。 


而 以 /开头 的 路 径 则 不 依赖 于 当前 目录 ， 所 以 被 称 为 绝对 路 径 
(absolute path) 。 可 以 使 用 os .path.abspath 来 找寻 文件 的 绝对 
路 径 : 


>>> os.path.abspath('memo.txt') 
'/home/dinsdale/memo.txt'" 


os .path 还 提供 了 其 他 函数 来 操作 文件 名 和 路 径 。 例 如 ， 
os .path.exists 检查 一 个 文件 或 目录 是 否 存 在 : 


>>> os.path.exists('memo.txt') 
True 


如 果 它 存在 ，os .path .isdir 可 以 检查 它 是 否 为 目录 : 


>>> os.path.isdir('memo.txt') 
False 
>>> os.path.isdir('/home/dinsdale') 


True 


类 似 地 ，os .path .isfile 检查 它 是 否 为 文件 。 


os .listdir 返回 指定 目录 中 文件 (以 及 其 他 目录 ) 的 列表 : 


>>> os.1istdir(cwd) 
['music', 'photos', 'memo.txt'] 


为 了 演示 这 些 函 数 ， 下 面 的 例子 “ 走 志 ”一 个 目录 ， 打 印 所 有 文件 
的 名 称 ， 并 对 之 中 的 子 目 孙 递 归 调 用 目 己 。 


def walk(dirname ) : 
for name in os.listdir(dirname): 
path = os.path.join(dirname, name) 


if os.path.isfile(path): 
print(path) 
else: 


walk(path) 


os .path.join 接收 一 个 目录 和 一 个 文件 名 称 ， 并 将 它们 拼接 为 


一 个 完整 的 路 径 。 


os 模块 提供 了 一 个 函数 walk ， 和 上 面 的 例子 作用 类 似 ， 但 功能 
更 丰富 。 作 为 练习 ， 请 阅读 文档 ， 并 使 用 它 打印 指定 目录 中 文件 的 名 
称 和 它 的 子 日 录 。 你 可 以 从 http://thinkpython2.com/code/walk.py 下 载 我 
的 解答 。 


14.5 ”捕获 异常 


当 演 试 读 取 和 写 入 文件 时 ， 很 多 东西 都 可 能 出 错 。 如 果 尝 试 打 开 
一 个 不 存在 的 文件 ， 会 得 到 一 个 IOError : 


>>> fin = open('bad file') 


IOError: [Errno 2] No such file or directory: 'bad_ file' 


如 果 没 有 权限 访问 一 个 文件 : 


>>> fout = open('/etc/passwd', 'w') 
PermissionError: [Errno 13] Permission denied: '/etc/passwd' 


如 果 壬 试 打开 一 个 目录 用 于 文件 读 取 ， 会 得 到 : 


>>> fin = open('/home') 
IsADirectoryError: [Errno 21] Is a directory: '/home' 


要 避免 这 些 错 误 ， 可 以 使 用 类 似 os .path.exists 和 
os,path,isfile 的 函数 ， 但 要 检查 所 有 的 可 能 需要 花费 大 量 时 间 
和 代码 (“Errno 21” 这 个 名 字 ， 说 明 至 少 有 21 种 可 能 出 错 的 地 方 ) 。 


最 好 是 直接 去 尝试 一 一 等 发 生 问 题 时 再 去 解决 它们 一 一 这 也 正 是 
try 语句 所 做 的 事情 。 语 法 和 if...else 语句 类 似 : 
try: 


fin = open('bad_file') 
except: 


print ('Something went wrong.') 


Python 会 完 从 try 子 句 开始 ， 如 果 一 切 顺 利 ， 则 跳 过 except 语 
句 并 继续 执行 。 如 果 发 生 了 异常 ， 则 跳出 try 子 句 ， 并 运行 except 
了 要 


使 用 try 语句 处 理 异 常 的 过 程 称 为 捕获 一 个 异常 。 在 这 个 例子 
里 ，except 语句 打印 的 错误 信息 并 没有 太 多 用 处 。 总 的 来 说 ， 捕 获 
异 角 给 了 你 一 个 修补 错误 的 机 会 ， 或 者 可 以 再 次 答 试 ， 或 者 至 少 能 够 
优雅 地 停止 程序 。 


14.6 ”数据 库 


数据 库 是 一 个 有 组 织 的 用 于 存储 数据 的 文件 。 许 多 数据 库 都 像 字 
典 一 样 组 织 数 据 ， 因 为 它们 也 将 键 映射 到 值 上。 数据 库 和 字典 之 间 最 
大 的 区 别 是 数据 库 是 保存 在 磁盘 上 (或 者 其 他 永久 存储 上 ) 的 ， 所 以 
当 程序 结束 时 它 也 能 持续 存在 。 


模块 dbm 提供 了 接口 用 于 创建 和 更 狐 数 据 库 文件 。 作 为 示例 ， 我 
将 会 创建 一 个 数据 库 保存 图 片 文件 的 标题 。 


打开 一 个 数据 库 和 打开 其 他 类 型 的 文件 差不多 : 


>>> import dbm 
>>> db = dbm.open('captions', 'c') 


模式 'c' 意味 着 数据 库 应 当 被 创建 ， 如 果 它 不 存在 的 话 。 调 用 的 
结 采 是 一 个 数据 库 对 象 ， (对 大 多 数 操作 ) 可 以 当 作 字 典 来 用 。 


当 创 建 一 个 新 项 时 ，dbm 会 更 新 数据 库 文件 。 


>>> db['cleese.png'] = 'Photo of John Cleese.' 


当 访问 数据 库 中 的 一 项 时 ，dbm 会 读 取 文件 : 


>>> db['cleese.png'] 
b'Photo of John Cleese.' 


这 里 的 结果 是 一 个 字 节 组 对 象 (bytes object) ， 因 此 以 b 开头 。 
字 太 组 对 象 和 字符 串 很 类 似 。 当 你 更 加 深入 人 研究 Python 的 时 候 ， 它 们 
的 区 别 可 能 会 变 得 很 重要 ， 但 现在 可 以 忽略 。 


如 果 对 一 个 已 经 存在 的 键 赋 值 ，dbm 会 蔡 换 旧 值 : 


>>> db['cleese.png'] = 'Photo of John Cleese doing a silly walk.' 
>>> db['cleese.png'] 


b'Photo of John Cleese doing a silly walk.' 


有 一 些 字典 方法 ， 如 keys 和 items ， 对 数据 库 对 象 不 可 以 使 
用 。 但 使 用 for 循环 来 迭代 遍历 是 可 以 的 : 


for key in db: 
print(key, db[key]) 


和 其 他 文件 一 样 ， 当 操作 结束 时 ， 需 要 关闭 数据 库 : 


14.7 ”封存 


dbnm 的 限制 之 一 古 键 和 值 都 必须 十 子 符 串 或 字 证 。 如 果 壬 试 使 用 
其 他 类 型 ， 则 会 出 现 错误 。 


pickle 模块 可 以 帮忙 。 它 可 以 将 几乎 所 有 类 型 的 对 象 转换 为 适 
合 保 存 到 数据 库 的 字符 串 形式 ， 并 可 以 将 字符 串 转换 回来 成 为 对 象 。 


pickle.dumps 接收 一 个 对 象 作为 参数 ， 并 返回 它 的 字符 串 表达 
形式 (dumps 是 “dump string” 的 简写 ， 意 即 转 储 字 符 串 ) : 


>>> import pickle 
>>> t = [1, 2, 3] 
>>> pickle.dumps(t 


) 
b'\x80\x03]q\x00(K\xO1K\x02K\x03e.' 


这 个 格式 不 适合 人 眼 阅读 ; 它 是 为 了 方便 pickle 模块 的 转换 而 
设计 的 。pickle.loads (load string， 即 加 载 字 符 串 ) 重新 构造 对 


>>> t1 = [1, 2, 3] 
>>> s = pickle.dumps(t1) 
>>> t2 = pickle.1loads(s) 


一 个 对 象 : 


也 就 是 说 ， 封 存 再 解 封 ， 和 复制 对 象 效果 相同 。 


你 可 以 使 用 pickle 回 数据 库 存储 非 字 符 串 的 值 。 事 实 上， 这 个 
组 合 如 此 常用 ， 以 至 于 Python 已 经 将 它们 封装 起 来 成 为 一 个 模块 ， 叫 
作 shelve 。 


14.8 ”管道 


大 部 分 操作 系统 都 提供 了 命令 行 接 口 ， 也 称 为 字符 界面 
(shell) 。 字 符 界 面 通常 会 提供 命令 来 浏览 文件 系统 和 局 动 应 用 程 
序 。 例 如 ， 在 Unix 中 ， 可 以 使 用 cd 来 更 换 目 录 ， 使 用 ls 来 展示 目录 
中 的 内 容 ， 以 及 打 入 firefox 来 启动 浏览 器 。 


任何 在 字符 界面 能 启动 的 程序 都 可 以 在 Python 中 使 用 管道 对 象 
(pipe object) 来 启动 。 管 道 对 象 代表 一 个 正在 运行 的 程序 


例如 ，Unix 命 令 1s -1 以 长 格式 展示 当前 目录 的 内 容 。 可 以 使 用 
0S .popen 叫 来 启动 ls : 


>>> cmd = ']s -1' 
>>> fp = os.popen(cmd) 


参数 是 一 个 字符 串 ， 它 包含 一 个 shell 命 令 。 oe 
的 文件 差不多 的 对 象 。 可 以 使 用 readline 来 逐 行 读 取 1s 进程 的 输 
出 ， 或 者 使 用 read 一 次 读 取 所 有 输出 : 


>>> res = fp.read() 


当 你 完成 时 ， 可 以 像 文件 一 样 关闭 这 个 管道 


>>> Stat = fp.close() 
>>> print(stat) 
None 


返回 值 是 1s 进程 的 最 终 状 态 ，None 代表 它 正常 结束 了 (没有 错 


误 ) 。 


例如 ， 大 部 分 Unix 系 统 都 提供 了 一 个 叫 作 md5sum 的 命令 ， 它 读 
取 文 件 的 内 容 并 计算 出 一 个 “ 校 验 和 ” (checksum) 。 你 可 以 在 
http:/en.wikipedia.org/wikiMd5 阅 读 MD5 的 相关 信息 。 这 个 命令 提供 了 
一 个 高 效 的 方法 ， 用 来 对 比 两 个 文件 是 否 包 含 相同 的 内 容 。 不 同 的 内 


容 生 成 相同 的 校 验 和 的 概率 极 低 〈 也 束 是 ， 在 宇宙 裔 泪 之 前 不 大 可 能 
> 


可 以 在 Python 中 使 用 管道 来 运行 nd5sum ， 并 获得 结果 : 


filename = 'book.tex' 

cmd = 'md5sum ' + filename 
fp = os.popen(cmd) 

res = fp.read() 

stat = fp.close() 


print res 
1e0033foed0656636de0d75144ba32e0 book.tex 
>>> print(stat) 
None 


14.9 ”编写 模块 


任何 包含 Python 代码 的 文件 都 可 以 作为 模块 导入 。 例 如 ， 如 果 你 
有 一 个 文件 wc .py ， 其 代码 如 下 : 


def linecount(filename): 
count = 0 
for line in open(filename): 
count += 1 
return count 


print(linecount('wc.py')) 


如 果 你 运行 这 个 程序 ， 它 会 读 取 目 身 的 内 容 ， 并 打印 出 文件 的 行 
数 ， 即 7。 你 也 可 以 像 这 样 导 入 它 : 


>>> import wc 
7 


现在 你 有 一 个 模块 对 象 wc 了 : 


>>> wc 
<module 'wc' from 'wc.py'> 


该 模块 对 象 提供 了 linecount : 


>>> wc.linecount('wc.py') 
7 


上 述 吏 是 在 Python 中 编写 模块 的 方法 。 


这 个 例子 唯一 的 问题 是 当 你 导入 模块 时 ， 写 会 运行 底部 的 测试 代 


作为 模块 导入 的 程序 ， 通 向 使 用 如 下 模式 : 


name __ 三 San 


print(linecount('wc.py')) 


征 一 个 内 置 变量 ， 当 程序 局 动 时 束 会 被 设置 。 如 果 程 
序 作 为 脚本 执行 ，__name__ 的 值 是 ' main__" ; 此 时 ， 测 试 代码 
会 被 运行 。 否 则 ， 如 果 程 序 作为 模块 被 导入 ， 则 测试 代码 就 被 跳 过 
了 。 


__Name 


作为 练习 ， 把 这 个 例子 输入 到 一 个 文件 wc ,py 中 ， 并 将 它 作为 一 
个 脚本 运行 。 然 后 运行 Python 解释 器 ， 并 导入 wc 。 当 模块 被 导入 时 ， 
name__ 的 值 是 什么 ? 


和 警告， 如 果 你 导入 一 个 已 经 被 导入 的 模块 ，Python 什 么 都 不 做 。 
它 不 会 重新 读 取 文 件 ， 即 使 文件 已 经 修改 。 


如 琳 你 想 要 重 载 一 个 模块 ， 可 以 使 用 内 鞋 画 数 reload ， 但 它 也 
可 能 会 有 棘手 的 问题 。 所 以 最 安全 的 办 法 是 重 局 解释 右 ， 并 再 次 导入 
模块 。 


14.10 ”调试 


当 你 读 取 和 写 入 文件 时 ， 可 能 会 遇 到 和 空白 字符 相关 的 问题 。 这 
些 问题 可 能 会 很 难 调试 ， 因 为 空格 、 制 表 符 和 换行 符 通 常 都 是 不 可 见 
的 : 
>>> s = '1 2\t 3Nn 4' 


>>> print(s) 
1 之 3 


4 


内 置 画 数 repr 可 以 帮忙 。 它 接收 任何 对 象 作为 参数 ， 并 返回 对 
象 的 字符 串 表 达 形 式 。 对 于 字符 串 来 说 ， 它 使 用 反 和 斜 杠 序列 来 展示 空 
目 宇 竺 : 


>>> print (repr(s)) 
'1 2\t 3\n 4' 


这 样 可 以 帮助 调试 。 


男 一 个 你 可 能 遇 到 的 问题 是 不 同 的 系统 使 用 不 同 的 字符 表示 换 
行 。 有 的 系统 使 用 一 个 换行 符 ， 即 \n。 另 外 的 系统 使 用 一 个 回 车 符 ， 


即 \r 。 也 有 的 系统 两 者 都 使 用 。 如 采 你 在 不 同 的 系统 间 移 动 文件 ， 这 
些 不 一 致 之 处 可 能 会 导致 问题 。 


大 多 数 系 统 都 有 程序 可 以 将 一 种 格式 转换 为 另 一 种 。 你 可 以 在 
http://en.wikipedia.org/wiki/ Newline 找 到 它们 (并 阅读 这 个 问题 的 更 多 
言 息 ) 。 或 者 ， 当 然 ， 你 也 可 以 自己 写 一 个 。 


14.11 术语 表 


持久 性 (persistent) :程序 的 一 种 属性 ， 它 会 一 直 运 行 ， 并 至 少 
保存 一 部 分 数据 在 永久 存储 中 。 


格式 操作 符 ”(format operator) : 一 个 操作 符 ， 即 % ， 它 接收 一 个 
格式 字符 串 ， 以 及 一 个 元 组 ， 并 生成 字符 串 ， 其 中 包括 了 元 组 的 各 个 
依据 格式 字符 串 里 指定 的 方式 格式 化 的 元 素 。 


格式 字符 串 (format string) : 一 个 字符 串 ， 被 格式 操作 符 所 用 ， 
内 部 包含 格式 序列 。 


格式 序列 (format sequence) : 格式 字符 串 中 出 现 的 字符 序列 ， 
如 %d ， 它 指定 一 个 值 如 何 格式 化 。 


文本 文件 (Mtext file) : 存储 在 类 似 硬盘 这 样 的 永久 存储 中 的 字符 
串 序列 。 


目录 “(directory) : 有 名 称 的 文件 集合 。 也 称 为 文件 夹 。 


路 径 (path) : 用 来 标定 一 个 文件 的 字符 串 。 


相对 路 径 (relative path) : 从 当前 目录 开始 的 路 径 。 


绝对 路 径 (absolute path) : 从 文件 系统 的 顶级 目录 开始 的 路 
A 


仁 。 
捕获 (catch) : 使 用 try 和 except 语句 来 阻止 一 个 异常 终止 程 
序 的 行为 。 


数据 库 (database) : 一 个 文件 ， 其 内 容 组 织 类 似 于 字典 ， 将 键 
映射 到 值 。 


字 节 组 对 象 “ (bytes object) : 一 个 和 字符 串 相似 的 对 象 。 


命令 行 (shell) : 一 个 程序 ， 人 允许 用 户 键入 命令 并 通过 调用 其 他 
程序 来 执行 这 些 命令 。 


管道 对 象 〈pipe object) : 代表 一 个 运行 中 的 程序 的 对 象 ， 让 
Python 程序 可 以 运行 命令 并 读 取 结 采 。 


14.12 练习 


练习 14-1 


写 一 个 名 为 sed 的 函数 ， 接 收 如 下 参数 : 一 个 模式 字符 串 ， 一 个 
符 换 用 字符 串 ， 以 及 两 个 文件 名 。 它 应 该 读 取 第 一 个 文件 ， 并 将 内 容 
写 入 第 二 个 文件 (如 采 需 要 则 新 建 它 ) 。 如 有 果 文 件 中 任何 地 方 出 现 了 
模式 字符 串 ， 应 该 奉 换 掉 。 


如 采 在 打开 、 读 取 、 写 入 或 天 闭 文件 的 过 程 中 过 到 钳 误 ， 你 的 程 
序 应 当 能 捕获 异 前 ， 打 印 一 个 错误 信息 ， 并 退出 。 


解答 : http://thinkpython2.com/code/sed.py ° 
练习 14-2 


如 果 你 从 http://thinkpython2.com/code/anagram_sets.py 下 载 我 对 练 
习 12-2 的 解答 ， 你 会 发 现 它 创建 一 个 字典 ， 将 一 个 排 好 序 的 字母 串 映 
射 到 可 以 由 这 些 字 母 组 成 的 单词 的 列表 。 例 如 ，'opst' 映射 到 
['opts', 'post', 'pots', 'spot', 'stop', 'tops'] 列 
表 o 


编写 一 个 模块 ， 导 入 anagram_sets ， 并 提供 两 个 新 函数 : 
store_anagrams 应 当 存储 回 文字 典 到 一 个 “shelf” 中 
read_anagrams 应 当 碍 询 一 个 单词 ， 并 返回 它 的 回 文 的 列表 。 


解答 : http://thinkpython2.com/code/anagram_db.py° 


练习 14-3 


在 一 个 庞大 的 MP3 文 件 的 集合 中 ， 有 可 能 同一 首 歌 有 多 个 副本 ， 
保存 在 不 同 的 目录 中 ， 或 者 文件 名 不 同 。 这 个 练习 的 目的 十 搜索 重复 
的 歌 。 


1. 编写 一 个 程序 递归 搜索 目 孙 及 其 所 有 的 子 目 未 ， 并 返回 所 有 指 
定 后 缀 (如 .mp3 ) 的 文件 的 完整 路 径 的 列表 。 提 示 : os.path 提供 
了 几 个 有 用 的 方法 来 操纵 文件 和 路 径 名 称 。 


2. 要 发 现 重复 文件 ， 需 要 使 用 md5sum 来 计算 每 个 文件 的 “ 校 验 
和 ”。 如 果 两 个 文件 的 校 验 和 相同 ， 它 们 很 可 能 有 相同 的 内 容 。 


3. 你 可 以 使 用 Unix 命 令 diff 来 复审 检验 。 

解答 : http://thinkpython2.com/code/find_duplicates.py 
[1] popen 现在 已 经 计划 废止 了 ， 也 就 古 说 我 们 应 当 不 再 使 用 它 ， 而 
是 开始 使 用 subprocess 模块 。 但 对 于 简单 的 情形 ， 我 发 现 


subprocess 过 度 复杂 了 “。 所 以 我 仍然 继续 使 用 popen ， 直 到 它 被 完 
全 废止 。 


第 15 章 ”类 和 对 象 


到 现在 你 已 经 知道 如 何 使 用 范 数 来 组 织 代 码 ， 以 及 如 何 用 内 置 类 
型 来 组 织 数 据 。 下 一 步 将 学 习 “ 面 向 对 象 编程 ”， 面 向 对 象 编程 使 用 目 
定义 的 类 型 同时 组 织 代码 和 数据 。 面 向 对 象 编程 是 一 个 很 大 的 话题 ， 
需要 好 几 章 来 讨论 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Pointl.py 下 
载 ， 练 习 的 解答 可 以 在 http://thinkpython2.com/code/Point1_soln.py 下 
载 o 


15.1 用 户 定 义 类 型 
我 们 已 经 使 用 了 很 多 Python 的 内 置 类 型 ， 现 在 我 们 要 定义 一 个 新 类 


型 。 作 为 示例 ， 我 们 将 会 新 建 一 个 类 型 Point ， 用 来 表示 二 维 空间 中 
ye 


在 数学 的 表示 法 中 ， 扩 通 前 使 用 括号 中 过 号 分 阳 两 个 坐标 表示 。 
例如 ，(0, 0) 表 示 原 点 ， 而 (x ,y ) 表 示 一 个 在 原点 右 侧 x 单位 ， 上 方 y 单 
位 的 点 。 


在 Python 中 ， 有 好 几 种 方法 可 以 表达 点 。 


。 我 们 可 以 将 两 个 坐标 分 别 伯 存 到 变量 x 和 y 中 。 
。 我 们 可 以 将 坐标 作为 列表 或 元 组 的 元 于 存储 。 


。 我 们 可 以 新 建 一 个 类 型 用 对 象 表达 点 。 


新 建 一 个 类 型 比 其 他 方法 更 复杂 一 些 ， 但 它 的 优点 很 快 束 会 显现 
出 来 。 


用 户 定 义 的 类 型 也 称 为 类 (class) 。 类 的 定义 如 下 所 示 : 


class Point: 
""Represents a point in 2-D space.™"™"" 


定义 头 表示 痢 的 类 名 为 Point 。 定 义 体 是 一 个 文档 字符 串 ， 解 释 
这 个 类 的 用 途 。 可 以 在 类 定义 中 定义 变量 和 函数 ， 我 们 会 在 后 面 回 到 


这 个 话题 


定义 一 个 叫 作 Point 的 类 会 创建 一 个 对 象 类 (object class) 


>>> Point 
<class ' main .Point'> 


因为 Point 是 在 程序 顶层 定义 的 ， 它 的 “全 名 "是 


mailin .Point 。 


类 对 象 像 一 个 创建 对 象 的 工厂 。 要 新 建 一 个 Point 对 象 ， 可 以 把 
Point 当 作 函数 来 调用 : 
>>> blank = Point() 


>>> blank 
<_ main .Point object at Oxb7e9d3ac> 


返回 值 是 到 一 个 Point 对 象 的 引用 ， 我 们 将 它 赋值 给 变量 blank 


新 建 一 个 对 象 的 过 程 称 为 实例 化 ”(instantiation) ， 而 对 象 是 这 个 
类 的 一 个 实例 。 


在 打印 一 个 实例 时 ，Python 会 告诉 你 它 所 属 的 类 型 ， 以 及 存储 在 内 
存 中 的 位 置 (前 缀 9x 表示 后 面 的 数字 是 十 六 进 制 的 ) 。 


每 个 对 象 都 是 某 个 类 的 实例 ， 所 以 “对 象 > 和 “实例 ”这 两 个 词 很 多 情 
况 下 都 可 以 互 换 。 但 是 ， 在 本 章 中 我 使 用 < 实例 "来 表示 一 个 自 定义 类 
型 的 对 象 。 

15.2 属性 


可 以 使 用 句点 表示 法 来 给 实例 赋值 : 


>>> blank.x 
>>> blank.y 


= 3.0 
= 4.0 
这 个 语法 和 从 模块 中 选择 变量 的 语法 类 似 ， 如 math .pi 或 者 
string,whitespace“。 但 在 这 种 情况 下 ， 我 们 是 将 值 赋 给 一 个 对 象 

的 有 命名 的 元 素 。 这 些 元 素 称 为 属性 (attribute) 。 


作为 名 词 时 ，“AT-trib-ute” 发 音 的 重音 在 第 一 个 音节 ， 这 与 作为 动 
词 的 “a-TRIB-ute” 不 同 。 


下 面 的 图 表 展 示 了 这 些 赋值 的 结果 。 展 示 一 个 对 象 和 其 属性 的 状 
态 图 称 为 对 象 图 (object diagram) ， 参 见 图 15-1。 


Point 
blank X 一 -> 3.0 


y 一 >~ 4.0 


图 15-1 对象 图 


变量 blank 引用 同一 个 Point 对 象 ， 它 包含 了 两 个 属性 。 每 个 属性 
引用 一 个 泽 扩 数 。 


可 以 使 用 相同 的 语法 来 读 取 一 个 属性 的 值 : 


属性 的 值 ”。 在 这 个 例子 中 ， 我 们 将 那个 值 赋值 给 一 个 变量 x 。 变量 x 
和 属性 x 并 不 冲突 。 


可 以 在 任意 表达 式 中 使 用 句点 表示 法 。 例 如 : 


>>> '(%g, %g)' % (blank.x, blank.y) 

'(3.0, 4.0)' 

>>> distance = math.sqrt(blank.x**2 + blank.y**2) 
>>> distance 


5.0 


可 以 将 一 个 实例 作为 实 参 按 通 音 的 方式 传递 。 例 如 : 


def print_point(p): 


print('(%g, %g)' % (p.x, p.y)) 


print_point 接收 一 个 点 作为 形 参 ， 并 按照 数学 表达 式 展示 它 。 
可 以 传 和 blank 作为 实 参 来 调用 它 : 


>>> print_point(blank) 
(3.0, 4.0) 


在 函数 中 ，p 是 blank 的 一 个 别名 ， 所 以 如 果 函 数 修改 了 p ， 则 
blank 也 会 改变 。 


作为 练习 ， 编 写 一 个 叫 作 distance_between_points 的 函 
数 ， 接 收 两 个 Point 对 象 作为 形 参 ， 并 返回 它们 之 间 的 距离 。 


15.3” 甜 形 


有 了 时候 对 象 应 该 有 哪些 属性 非常 明显 ， 但 也 有 时候 需 要 你 来 做 决 
定 。 例 如 ， 假 设 你 在 设计 一 个 表达 卸 形 的 类 。 你 会 用 什么 属性 来 指定 
一 个 矩形 的 位 置 和 斥 十 呢 ? 可 以 忽略 角度 ， 为 了 简单 起 见 ， 假 定 和 矩形 
不 征 垂 直 的 束 是 水 平 的 。 


最 少 有 以 下 两 种 可 能 。 


。 可 以 指定 一 个 矩形 的 一 个 角落 《或 者 中 心 点 ) 、 视 度 以 及 高 度 。 
。 可 以 指定 两 个 相对 的 角落 。 


现在 还 很 难说 哪 一 种 方案 更 好 ， 所 以 作为 示例 ， 我 们 仅 完 实现 第 


= 


下 面 是 这 个 类 的 定义 : 


class Rectangle: 
"""Represents a rectangle. 


attributes: width, height, corner. 


文档 字符 串 列 出 了 属性 : width 和 height 是 数字 ; corner 是 
一 个 Point 对 象 ， 用 来 指定 左下 角 的 顶点 。 


要 表达 一 个 和 矩形， 需要 实例 化 一 个 Rectangle 对 象 ， 并 对 其 属性 赋 


= Rectangle() 
.Width = 100.0 
.height = 200.0 
,Corner = Point() 


.Corner.x = 0.0 
.Corner.y = 0.0 


表达 式 box .corner .x 表示 ,“ 去 往 box 引用 的 对 象 ， 并 选择 属 
性 corner ; 接着 去 往 那 个 对 象 ， 并 选择 属性 x”。 


图 15-2 展 示 了 这 个 对 象 的 状态 。 作 为 男 一 个 对 象 的 属性 存在 的 对 象 
是 内 嵌 的 。 


Rectangle 


box 一 =| width 一 = 100.0 


Point 
corner y eI 


图 15-2 对象 图 


15.4 ”作为 返回 值 的 实例 


函数 可 以 返回 实例 。 例 如 ，find_center 接收 Rectangle 对 象 
作为 参数 ， 并 返回 一 个 Point 对 象 ， 包 含 这 个 Rectangle 的 中 心 点 
的 坐标 : 


def find_center(rect ) : 
p = Point() 
= rect.corner.x + rect.width/2 


= rect.corner.y + rect.height/2 
return p 


下 面 是 一 个 示例 ， 传 入 box 作为 实 参 ， 并 将 结果 的 Point 对 象 赋 给 


变量 Center : 


>>> Center = find_center(box ) 
>>> print_point(center ) 


(50, 100) 


15.5 ”对 和 象 是 可 变 的 


可 以 通过 给 一 个 对 象 的 某 个 属性 赋值 来 修改 它 的 状态 。 例 如 ， 要 
修改 一 个 矩形 的 尺寸 而 保持 它 的 位 置 不 变 ， 可 以 修改 属性 width 和 
height 的 值 : 


box.width = box.width + 50 
box.height = box.height + 100 


也 可 以 编写 函数 来 修改 对 象 。 例 如 ，grow_rectangle 接收 一 个 
Rectangle 对 象 和 两 个 数 ，dwidth 和 dheight ， 并 把 这 些 数 加 到 甜 形 
的 宽度 和 高 度 上 : 


def grow_rectangle(rect, dwidth, dheight): 


rect.width += dwidth 
rect.height += dheight 


下 面 是 展示 这 个 函数 效果 的 示例 : 


>>> box.width, box.height 
(150.0, 300.0) 
>>> grow_rectangle(box, 50, 100) 


>>> box.width, box.height 
(200.0, 400.0) 


在 函数 中 ，rect 是 box 的 别名 ， 所 以 如 果 当 修改 了 rect 时 ， 
box 也 改变 。 


作为 练习 ， 编 写 一 个 名 为 move_rectangle 的 函数 ， 接 收 一 个 
Rectangle 对 象 和 两 个 分 别名 为 dx 和 dy 的 数值 。 它 应 当 通 过 将 dx 添加 
到 corner 的 x 坐标 和 将 dy 添加 到 corner 的 y 坐标 来 改变 矩形 的 位 
Es 


15.6 ”复制 


别名 的 使 用 有 时 候 会 让 程序 更 难 阅读 ， 因 为 一 个 地 方 的 修改 可 能 
会 给 其 他 地 方 带 来 意 想 不 到 的 变化 。 要 跟踪 掌握 所 有 3 引用 到 一 个 给 定 
对 象 的 变量 非常 困难 。 


使 用 别名 的 常用 替代 方案 是 复制 对 象 。copy 模块 里 有 一 个 函数 
copy 可 以 复制 任何 对 象 : 


>>> p1 = Point() 
>>> p1.Xx = 3.0 
>>> p1.y = 4.0 


>>> import copy 
>>> p2 = copy.copy(p1) 


pl 和 p2 包含 相同 的 数据 ， 但 是 它们 不 是 同一 个 Point 对 象 。 


>>> print_point(p1) 

(3, 4) 

>>> print_point(p2) 
) 


正如 我 们 预料 ，is 操作 符 告 诉 我 们 p1 和 p2 不 是 同一 个 对 象 。 但 
你 可 能 会 预料 == 能 得 到 True 值 ， 因 为 这 两 个 点 包含 相同 的 数据 。 如 


果 那 样 ， 你 会 失望 地 发 现 对 于 实例 来 说 ，== 操作 符 的 上 默认 行为 和 is 
操作 符 相 同 ， 它 会 检查 对 象 同一 性 ， 而 不 是 对 象 相 等 性 。 这 是 因为 对 
于 用 户 目 定义 类 型 ，Python 并 不 知道 怎么 才 算 相等 。 至 少 现在 还 不 行 。 


如 果 使 用 copy .copy 复制 一 个 Rectangle， 你 会 发 现 它 复制 了 
Rectangle 对 象 但 并 不 复制 内 骨 的 Point 对 和 象 : 
>>> box2 = copy.copy(box) 


>>> box2 is box 
False 


>>> box2.corner is box.corner 
True 


图 15-3 展 示 了 这 个 操作 的 对 象 图 。 这 个 操作 称 为 浅 复制 (shallow 
copy) ， 因 为 它 复 制 对 象 及 其 包含 的 任何 引用 ， 但 不 复制 内 藤 对 象 


box width —= 100.0 100.0<=— width |<—box2 
height —= 200.0 200.0<=— height 


corner corner 


图 15-3 ”对 象 图 


对 于 大 多 数 应 用 ， 这 并 不 是 你 所 想 要 的 。 在 这 个 例子 里 ， 对 一 个 
Rectangle 对 象 调 用 grow_rectangle 并 不 会 影响 其 他 对 象 ， 但 对 任何 
一 个 Rectangle 对 象 调用 move_rectangle 都 会 影响 全 部 两 个 对 象 ! 这 
种 行为 既 混 乱 不 清 ， 又 容易 导致 错误 。 


地 好 ，copy 模块 还 提供 了 一 个 名 为 deepcopy 的 方法， 它 不 但 复 
制 对 象 ， 还 会 复制 对 象 中 引用 的 对 象 ， 甚 至 它们 引用 的 对 象 ， 依 次 类 
推 。 所 以 你 并 不 会 惊讶 这 个 操作 为 何 称 为 深 复制 (deep copy) 。 


>>> box3 = copy.deepcopy(box) 
>>> box3 is box 

False 

>>> box3.corner is box.corner 
False 


box3 和 box 是 两 个 完全 分 开 的 对 象 。 


作为 练习 ， 编 写 move_rectangle 的 男 一 个 版 本 ， 它 会 新 建 并 返 
回 一 个 Rectangle 对 象 ， 而 不 是 直接 修改 旧 对 象 。 


15.7 ”调试 


开始 操作 对 象 时 ， 可 能 会 遇 到 一 些 新 的 异常 。 如 果 试 图 访问 一 个 
并 不 存在 的 属性 ， 会 得 到 AttributeError : 


Point() 
3 


4 


teError: Point instance has no attribute 'z' 


如 琳 不 清楚 一 个 对 象 是 什么 类 型 ， 可 以 问 : 


>>> type(p) 
<class ' _ main _.Point'> 


也 可 以 使 用 isinstance 来 检查 对 象 是 否 是 某 个 类 的 实例 : 


>>> isinstance(p,Point) 
True 


如 果 不 确 定 一 个 对 象 是 否 拥有 某 个 特定 的 属性 ， 可 以 使 用 内 置 函 
数 hasattr : 


>>> hasattr(p, 'x') 
True 


>>> hasattr(p, 'z') 
False 


第 一 个 形 参 可 以 是 任何 对 象 ， 第 二 个 形 参 是 一 个 包含 属 性 名 称 的 


也 可 以 使 用 try 语句 来 尝试 对 象 是 否 拥有 你 需要 的 属性 : 


x = p.x 
except AttributeError: 


x=0 


这 种 方法 可 以 使 编写 适用 于 不 同类 型 的 丽 数 更 加 容易 。 关 于 这 一 
主题 的 更 多 内 容 参 见 17.9 字 。 
15.8 ”术语 表 

类 (class) : 一 个 用 户 定 义 的 类 型 。 类 定义 会 新 建 一 个 类 对 象 。 


类 对 象 (class object) : 一 个 包含 用 户 定 义 类 型 的 信息 的 对 象 。 
类 对 象 可 以 用 来 创建 该 类 型 的 实例 。 


实例 ”(instance) : 属于 某 个 类 的 一 个 对 象 。 
实例 化 ”(instanciate) : 创建 一 个 新 对 象 。 


属性 attribute) : 一 个 对 象 中 关联 的 有 命名 的 值 。 


内 答对 象 (embedded object) : 作为 一 个 对 象 的 属性 存储 的 对 
象 。 


浅 复 制 (shallow copy) : 复制 对 象 的 内 容 ， 包 括 内 扔 对 象 的 引 
用 ; copy 模块 中 的 copy 函数 实现 了 这 个 功能 


深 复制 (deep copy) : 复制 对 象 的 内 容 ， 也 包括 内 藤 对 象 ， 以 及 
它们 内 骨 的 对 象 ， 依 次 类 推 ，copy 模块 中 的 deepcopy 函数 实现 了 这 
个 功能 。 


对 象 图 (object diagram) : 一 个 展示 对 象 、 对 象 的 属性 以 及 属性 
的 值 的 图 。 
15.9 ”练习 

练习 15-1 


定义 一 个 新 的 名 为 Circle 的 类 表示 圆 形 ， 它 的 属性 有 center 和 


radius ， 其 中 center 是 一 个 Point 对 象 ， 而 radius 是 一 个 数 。 


实例 化 一 个 Circle 对 象 来 代表 一 个 圆心 在 (150, 100)、 半 径 为 75 的 圆 
形 。 

编写 一 个 函数 point_in_circle ， 接 收 一 个 Circle 对 象 和 一 个 
Point 对 象 ， 并 当 Point 处 于 Circle 的 边界 或 其 内 时 返回 True 。 


编写 一 个 函数 rect_in_circle ， 接 收 一 个 Circle 对 象 和 一 个 
Rectangle 对 象 ， 并 在 Rectangle 的 任何 一 个 角落 在 Circle 之 内 时 返回 


True。 另 外 ， 还 有 一 个 更 难 的 版 本 ， 需 要 在 Rectangle 的 任何 部 分 都 落 在 
圆圈 之 内 时 返回 True 。 


解答 : http://thinkpython2.com/code/Circle.py 。 
AM 避 15-2 


编写 一 个 名 为 draw_rect 的 函数 ， 接 收 一 个 Turtle 对 象 和 一 个 
Rectangle 对 象 作为 形 参 ， 并 使 用 Turtle 来 绘制 这 个 Rectangle。 如 何 使 用 
Turtle 对 象 的 示例 参见 第 4 章 。 


编写 一 个 名 为 draw_rect 的 函数 ， 接 收 一 个 Turte 对 象 和 一 个 
Circle 对 象 ， 并 绘制 出 Circle 。 


解答 : http://thinkpython2.com/code/draw.py ° 


第 16 蔓 ”类 和 函数 


现在 我 们 已 经 知道 如 何 创 建新 的 类 型 ， 下 一 步 是 编写 接收 用 户 定 
义 对 象 作为 参数 或 者 将 其 当 作 结 采 返 回 的 钞 数 。 本 章 我 会 展示 “ 范 数 式 
编程 风格 ”， 以 及 两 个 新 的 程序 开发 计划 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Timel.py 下 
载 。 练 习 的 解答 在 http:Wthinkpython2.com/code/Time1l_soln.py。 


16.1 时 间 


作为 用 户 定 义 类 型 的 男 一 个 例子 ， 我 们 定义 一 个 叫 作 Time 的 
类 ， 用 于 记录 一 天 里 的 时 间 。 类 定义 如 下 : 


class Time: 
"""Represents the time of day. 


attributes: hour, minute, second 
1 


我 们 可 以 创建 一 个 Time 对 象 并 给 其 属性 小 时 数 、 分 钟 数 和 秒 钟 
数 赋值 : 
time = Time() 


time.hour = 11 
time.minute = 59 


time.second = 30 


Time 对 象 的 状态 图 参见 图 16-1 。 


作为 练习 ， 编 写 一 个 叫 作 print_time 的 函数 ， 接 收 一 个 Time 对 
象 作 为 形 参 并 以 “hour :minute:second ”的 格式 打印 它 。 提 示 : 格 
式 序列 '%,2d' 可 以 以 最 少 两 个 字符 打印 一 个 整数 ， 如 果 需 要 ， 它 会 
在 前 面 添 加 前 级 0 


Time 
time 一 一 > hour 一 11 


minute 一 = 59 


second 一 = 30 


图 16-1 对象 图 


编写 一 个 布尔 函数 is_after ， 接 收 两 个 Time 对 象 ，t1 和 t2 ， 
并 若 t1 在 t2 时 间 之 后 则 返回 True ， 否 则 返回 False 。 挑 战 : 不 许 
使 用 if 表达 式 。 


16.2” 纯 画 数 


在 下 面 儿 市 中 ， 我 们 会 编写 两 个 用 来 增加 时 间 值 的 函 数 。 它 们 展 
示 了 两 种 不 同类 型 的 函数 ， 纯 画 数 和 修改 右 。 它 们 也 展示 了 我 会 称 为 
原型 和 补丁 (prototype and patch) 的 开发 计划 。 这 是 一 种 对 应 复杂 问 
题 的 方法 ， 从 一 个 简单 的 原型 开始 ， 并 逐渐 解决 更 多 的 复杂 情况 。 


下 面 是 add_time 的 一 个 简单 原型 : 


def add_ time(t1i, t2): 
sum = Time() 
sum.hour = t1.hour + t2.hour 
sum.minute = ti.minute + t2.minute 


sum.second = t1.second + t2.second 
return sum 


这 个 函数 创建 一 个 新 的 Time 对 象 ， 初 始 化 它 的 属性 ， 并 返回 这 个 
新 对 象 的 一 个 引用 。 这 被 称 为 一 个 纯 画 数 ， 因 为 它 除了 返回 一 个 值 之 
外 ， 并 不 修改 作为 实 参 传 入 的 任何 对 象 ， 也 没有 任何 如 显示 值 或 获得 
用 户 输入 之 类 的 副作用 。 


为 了 测试 这 个 函数 ， 我 将 创建 两 个 Time 对 象 : start ， 存 放 一 个 
影 (如 Monty Python and the Holy Grail ) 的 开始 时 间 ; duration 
， 存 放电 影 的 播放 时 间 ， 在 这 里 是 1 小 时 35 分 钟 。 


add_time 计算 出 电影 何 时 结 


>>> Start = Time() 

start.hour = 9 
>>> Start,minute = 
>>> start.second = 


>>> duration = Time( 

>>> duration.hour = 

>>> duration.minute 35 
>>> duration.second 0 


>>> done = add time(start, duration) 
>>> print_time(done) 
10:80:00 


结果 10:80 :99 可 能 并 不 古 你 所 期 望 的 。 问 题 在 于 这 个 函数 并 没 
有 处 理 好 秒 数 或 者 分 钟 数 超过 60 的 情况 。 当 此 发 生 时 ， 我 们 需要 将 多 
余 的 秒 数 “ 进 位 ”到 分 钟 数 ， 将 多 余 的 分 钟 数 “ 进 位 ”到 小 时 数 。 


下 面 是 一 个 改进 的 版 本 : 


def add_ time(t1i, t2): 
sum = Time() 
sum.hour = t1.hour + t2.hour 
sum.minute = ti.minute + t2.minute 
sum,.second = t1.second + t2.second 


if sum.second >= 60: 
sum.second -= 60 
sum.minute += 1 


if sum.minute >= 60: 
sum.minute -= 60 
sum.hour += 1 


return sum 


虽然 这 个 函数 是 正确 的 ， 它 已 经 开始 变 大 了 。 我 们 会 在 后 面 看 到 
一 个 更 短 的 版 本 。 


16.3 ”修改 器 


有 时 候 用 函数 修改 传 入 的 参数 对 象 是 很 有 用 的 。 在 这 种 情况 下 ， 
修改 对 调用 者 是 可 见 的 。 这 样 工 作 的 函数 称 为 修改 器 (modifier) 。 


函数 increment 给 一 个 Time 对 象 增加 指定 的 秒 数 ， 可 以 目 然 地 
写 为 一 个 修改 器 。 下 面 是 一 个 初稿 : 


def increment(time, seconds): 
time.second += Seconds 


if time.second >= 60: 
time.second -= 60 
time.minute += 1 


if time.minute >= 60: 
time.minute -= 60 
time.hour += 1 


第 一 行进 行 基础 操作 ;， 后面 的 代码 处 理 我 们 前 面 看 到 的 特殊 情 


这 个 函数 正确 吗 ? 如 果 seconds 比 60 大 很 多 ， 会 发 生 什么 ? 


在 那 种 情况 下 ， 只 进位 一 次 是 不 够 的 ， 我 们 需要 重复 进位 ， 直 到 
time.second 比 60 小 。 一 个 办 法 是 使 用 while 语句 替代 if 语句 。 
那样 会 让 函数 变 正确 ， 但 并 不 很 高 效 。 作 为 练习 ， 编 写 正 确 的 
increment 版 本 ， 并 不 包含 任何 循环 。 


任何 可 以 使 用 修改 絮 做 到 的 功能 都 可 以 使 用 纯 函数 实现 。 事 实 
上 ， 有 的 编程 语言 只 允许 使 用 纯 函 数 。 有 证 据 表明 使 用 纯 函 数 的 程序 
比 使 用 修改 器 的 程序 开发 更 快 ， 错 误 更 少 。 但 有 时 候 修 改 器 还 是 很 方 
便 的 ， 并 且 驴 数 式 程序 的 运行 效率 不 那么 高 。 


总 的 来 说 ， 我 推荐 你 只 要 合理 的 时 候 ， 都 尽量 编写 纯 画 数 ， 而 只 
在 有 绝对 说 服 力 的 原因 时 才 使 用 修改 器 。 这 种 方法 可 以 称 作 画 数 式 编 
程 风格 。 


作为 练习 ， 编 写 一 个 increment 的 纯 画 数 版 本 ， 创 建 并 返回 一 
个 新 的 Time 对 象 ， 而 不 是 修改 参数 。 


16.4 原型 和 计划 


刚才 我 展示 的 开发 计划 称 为 "原型 和 补丁 ”。 对 每 个 男 数 ， 我 编写 
一 个 可 以 进行 基本 计算 的 原型 ， 再 测试 它 ， 从 中 发 现 错误 并 打 补 丁 。 


这 种 方法 在 对 问题 的 理解 并 不 深入 时 尤其 有 效 。 但 增 量 地 修正 可 
能 会 导致 代码 过 度 复杂 (因为 它们 需要 处 理 很 多 特殊 情况 )  ， 并 且 也 
不 够 可 靠 《因为 很 难 知道 你 是 否 已 经 找到 了 所 有 错误 ) 。 


另 一 种 方法 是 有 规划 开发 〈designed development) 。 对 问题 有 更 
高 阶 的 理解 能 够 让 编程 简单 得 多 。 在 上 面 的 问题 中 ， 如 果 更 深入 地 理 
解 ， 可 以 发 现 Time 对 象 实际 上 是 六 十 进 制 数 里 的 3 位 数 (参见 
http://en.wikipedia.org/wiki/Sexagesimal) ! second 属性 是 “个 位 数 ”， 
minute 属性 是 “60 位 数 "， 而 hour 属性 是 “360 位 数 ”。 


在 编写 add_time 和 increment 时 ， 我 们 实际 上 是 在 六 十 进 制 
上 进行 加 减 ， 因 此 才 需 要 从 一 位 进位 到 另 一 位 。 


这 个 观察 让 我 们 可 以 考虑 整个 问题 的 男 一 种 解决 方法 一 一 我 们 可 
以 将 Time 对 象 转换 为 整数 ， 并 利用 计算 机 知道 如 何 做 整数 运算 的 事 


下 面 是 一 个 将 Time 对 象 园 换 为 整数 的 函数 : 


def time_to_int(time ) : 
minutes = time.hour * 60 + time.minute 
seconds = minutes * 60 + time.second 


return seconds 


而 下 面 是 一 个 将 整数 转换 回 Time 对 象 的 函数 〈 记 着 divmod 函数 
将 第 一 个 参数 除 以 第 二 个 参数 ， 并 以 元 组 的 形式 返回 商 和 余数 ) : 
def int_to_time(Seconds ) : 


time = Time() 
minutes, time.second = divmod(seconds, 60) 


time.hour, time.minute = divmod(minutes, 60) 
return time 


你 可 能 需要 思考 一 下 ， 并 运行 一 些 测 试 ， 来 说 服 目 己 这 些 函 数 是 
正确 的 。 一 种 测试 它们 的 方法 是 对 很 多 x 值 检查 
time_to_int(int_to_time(x)) == X。 这 是 一 致 性 检验 的 一 个 


网 下 


一 旦 确认 它们 是 正确 的 ， 束 可 以 使 用 它们 重 写 add_time : 


def add_ time(t1i, t2): 
seconds = time_to_int(t1) + time_ to_int(t2) 


return int_to_time(seconds) 


这 个 版 本 比 最 初版 本 短 得 多 ， 并 且 也 很 容易 检验 。 作 为 练习 ， 使 
用 time_ to _int 和 int_ to _time 重 写 increment 函数 。 


从 某 个 角度 看 ， 在 六 十 进 制 和 十 进 制 之 间 来 回转 换 比 只 处 理 时 间 
更 难 。 进 制 转换 更 加 抽象 ， 我们 对 时 间 值 的 直觉 更 好 。 


但 如 果 我 们 将 时 间 看 作 六 十 进 制 数 ， 并 做 好 了 编写 转换 函数 
(time_to_int 和 int_to_time ) 的 先期 投入 ， 就 能 得 到 一 个 更 
短 ， 更 可 读 ， 也 更 可 靠 的 函数 。 


它 也 让 我 们 今后 更 容易 添加 功能 。 例 如 ， 假 设 将 两 个 Time 对 象 相 
城 来 获得 它们 之 间 的 时 间 间 隅 。 稍 单 的 做 法 是 使 用 借 位 实现 减法 。 而 
使 用 转换 函数 则 更 简单 ， 且 更 容易 正确 。 


讽刺 的 是 ， 有 时 候 把 一 个 问题 弄 得 更 难 (或 者 更 通用 ) 反而 会 让 
它 更 简单 《因为 会 有 更 少 的 特殊 情况 以 及 更 少 的 出 错 机 会 ) 。 


16.5 “调试 


一 个 Time 对 象 当 minute 和 second 的 值 在 0 到 60 之 间 (包含 0 但 
不 包含 60) 以 及 hour 是 正 值 时 ， 是 合法 的 。hour 和 minute 应 当 是 
整数 值 ， 但 我 们 也 许 需 要 人 允许 second 拥有 小 数值 。 


这 些 需求 称 为 不 变 式 ， 因 为 它们 应 当 总 是 为 真 。 换 名 话说， 如 果 
它们 不 为 真 ， 则 一 定 有 什么 地 方 出 错 了 。 


编写 代码 来 检查 不 变 式 可 以 帮 你 探测 错误 并 找寻 它们 的 根源 。 例 
如 ， 你 可 以 写 一 个 像 valid_time 这 样 的 函数 ， 接 收 Time 对 象 ， 并 在 
它 违 反 了 一 个 不 变 式 时 ， 返 回 False : 


def valid_ time(time) : 
if time.hour < 0 or time.minute < 0 or time.second < 0: 
return False 
If time.minute >= 60 or time.second >= 60: 


return False 
return True 


接 看 在 每 个 画 数 的 开头 ， 可 以 检查 参数 ， 确 保 它 们 是 有 效 的 : 


def add_ time(t1i, t2): 
if not valid time(t1) or not valid time(t2): 
raise ValueError('invalid Time object in add_time') 


seconds = time_to_int(t1) + time_ to_int(t2) 
return int_to_time(seconds) 


或 者 可 以 使 用 一 个 assert 语句 。 它 会 检查 一 个 给 定 的 不 变 式 ， 
并 当 检 查 失败 时 抛 出 异常 : 
def add_ time(t1i, t2): 


assert valid time(t1) and valid time(t2) 
seconds = time to_int(t1i) + time_ to_int(t2) 


return int_to_time(seconds) 


assert 语句 很 用， 因为 它们 区 分 了 处 理 普 通 条 件 的 代码 和 检 
查 错误 的 代码 。 


16.6 ”术语 表 


原型 和 补丁 (prototype and patch) : 一 种 开发 计划 模式 ， 先 编写 
程序 的 粗略 原型 ， 并 测试 ， 在 找到 错误 时 更 正 。 


有 规划 开发 (planned development) : 一 种 开发 计划 模式 ， 先 对 
问题 有 了 高 阶 的 深入 理解 ， 并 且 比 增 量 开发 或 者 原型 开发 有 更 多 的 规 
划 。 


纯 函 数 (pure function) : 不 修改 任何 形 参 对 象 的 函数 。 大 部 分 
纯 函 数 都 有 返回 值 。 


修改 器 (modifier) : 修改 一 个 或 多 个 形 参 对 象 的 函数 。 大 部 分 
修改 器 都 不 返回 值 ， 也 就 是 返回 None 。 


函数 式 编 程 风 格 (functional programming style) : 一 种 编程 设计 
风格 ， 其 中 大 部 分 函数 都 是 纯 函 数 。 


不 变 式 (invariant) : 在 程序 的 执行 过 程 中 应 当 总 是 为 真 的 条 
1 


assert 语句 (assert statement) : 一 种 检查 某 个 条 件 ， 如 果 检 查 
失败 则 抛 出 异常 的 语句 。 
16.7 练习 


本 章 中 的 代码 示例 可 以 从 http://thinkpython2.com/code/Timel.py 下 
载 ， 这 些 练习 的 解答 可 以 从 http://thinkpython2.com/code/Time1_soln.py 
下 载 。 


练习 16-1 


编写 一 个 函数 mul_time 接收 一 个 Time 对 象 以 及 一 个 整数 ， 返 回 
一 个 新 的 Time 对 象 ， 包 含 原 始 时 间 和 整数 的 乘积 。 


然后 使 用 mul_time 来 编写 一 个 范 数 ， 接 收 一 个 Time 对 象 表示 一 
场 赛车 的 结束 时 间 ， 以 及 一 个 表示 距离 的 数字 ， 并 返回 一 个 Time 对 象 
表达 平均 节奏 (每 瑞 里 花费 的 时 间 ) 


练习 16-2 


datetime 模块 提供 了 time 对 象 ， 和 本 章 中 的 Time 对 象 类 似 ， 
但 它们 提供 了 更 丰富 的 方法 和 操作 符 。 在 
http:/docs.python.org/3/Vlibrary/datetime.html 赔 读 相 关 文 档 。 


1. 使 用 datet ime 模块 来 编写 一 个 程序 获取 当前 日 期 并 打印 出 
今天 是 周 几 。 


2 编写 一 个 程序 接收 生日 作为 输入 ， 并 打印 出 用 户 的 年 龄 ， 以 及 
到 他 们 下 一 次 生日 还 需要 的 天 数 、 小 时 数 、 分 钟 数 和 秒 数 。 


3. 对 于 生 于 不 同 天 的 两 个 人 ， 总 有 一 天 ， 一 个 人 的 年 龄 是 男 一 个 
人 的 两 倍 。 我 们 称 这 有 是 他 们 的 “ 双 倍 日 ”。 编 写 一 个 程序 接收 两 个 生 
日 ， 并 计算 出 它们 的 “ 双 倍 日 ”。 


4. 再 增加 一 点 挑战 ， 编 写 一 个 更 通用 的 版 本 ， 计 算 一 个 人 比 另 一 
个 人 大 n 倍 的 日 子 。 


解答 : http://thinkpython2.com/code/double.py。° 


第 17 章 ”类 和 方法 


虽然 我 们 已 经 使 用 了 Python 的 一 些 面 向 对 象 特性 ， 但 前 两 草 的 程 
序 还 算 不 上 真正 的 面向 对 象 ， 因 为 它们 没有 体现 用 户 目 定义 类 型 之 间 
的 关联 ， 以 及 操作 它们 的 函数 。 下 一 步 是 将 那些 函数 转换 成 方法 ， 让 
这 种 关联 更 加 明显 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.conmycode/Time2.py 下 
载 ， 而 本 章 练 习 的 解答 参见 
http://thinkpython2.com/code/Point2_soln.py ° 


17.1 面向 对 象 特性 


Python 是 一 门面 向 对 象 编程 语言 ， 它 提供 了 一 些 文 持 面向 对 象 纺 
程 的 语言 特性 ， 这 些 特性 有 如 下 明确 的 特征 。 


。 程序 包括 类 定义 和 方法 定义 。 

。 大 部 分 计算 都 通过 对 象 的 操作 来 表达 。 

。 每 个 对 象 定 义 对 应 真实 世界 的 某 些 对 象 或 概念 ， 而 方法 则 对 应 真 
实 世 界 中 对 象 之 间 交 互 的 方式 。 


例如 ， 第 16 章 中 定义 的 Time 类 对 应 于 人 们 记录 一 天 中 的 时 间 的 
方式 ， 而 其 中 我 们 定义 的 函数 对 应 于 人 们 平时 处 理 时 间 所 做 的 事情 。 
类 似 地 ，Point 和 Rectangle 类 对 应 于 数学 中 点 和 和 矩形 的 概念 。 


目前 为 止 ， 我 们 还 没有 利用 上 Python 所 提供 的 面向 对 象 编程 特 
性 。 严 格 地 说 ， 这 些 特性 并 不 是 必需 的 ， 它 们 中 大 部 分 都 是 我 们 已 经 
做 过 的 事情 的 另 一 种 选择 方案 。 但 在 很 多 情况 下 ， 这 种 方案 更 简洁 ， 
更 能 准确 地 表达 程序 的 结构 。 


例如 ， 在 Time1. py 程序 中 ， 类 定义 和 接 看 的 钞 数 定义 并 没有 了 明 
显 的 关联 。 稍 加 观察 ， 很 明显 每 个 函数 都 至 少 接收 一 个 Time 对 象 作 为 
参数 。 


这 种 现象 就 是 方法 的 由 来 。 一 个 方法 即 是 和 某 个 特定 类 相关 联 的 
画 数 。 我 们 已 经 见 过 字符 串 、 列 表 、 字 典 和 元 组 的 方法 。 本 章 中 ， 我 
们 会 为 用 户 定义 类 型 定义 方法 。 


方法 和 函数 在 语义 上 是 一 样 的 ， 但 在 语法 上 有 两 个 区 别 。 


。 方法 定义 写 在 类 定义 之 中 ， 更 明确 的 表示 类 和 方法 的 关联 。 

。 调 用 方法 和 调用 画 数 的 语法 形式 不 同 。 

在 接 下 来 几 节 中 ， 我 们 会 将 前 两 章 中 定义 的 画 数 转换 为 方法 。 这 
种 转换 是 纯 机 械 式 的 ， 你 可 以 依照 一 系列 步 又 完成 它 。 如 果 你 能 够 轻 
松 地 在 方法 和 画 数 之 间 转 换 ， 也 就 能 够 在 任何 情况 下 选择 最 适合 的 形 
式 了 。 


17.2 ”打印 对 象 


在 第 16 章 中 ， 我 们 在 练习 16-1 中 定义 了 一 个 名 为 Time 的 类 ， 你 写 
过 一 个 名 为 print_time 的 函数 : 


class Time : 
"""Represents the time of day.""" 


def print_time(time): 
print('%.2d:%.2d:%.2d' % (time.hour, time.minute, 
time.second)) 


要 调用 这 个 函数 ， 需 要 传 入 一 个 Time 对 象 作为 实 参 : 


>>> start = Time() 
>>> Start,hour = 9 
>>> start.minute = 45 
>>> start.second = 00 
>>> print_time(start) 
09:45:00 


要 把 print_time 转换 为 方法 ， 我 们 只 需要 将 画 数 定义 移动 到 类 
定义 中 即 可 。 注 意 缩 进 的 改变 。 
class Time: 


def print_time(time): 
print('%.2d:%.2d:%.2d' % (time.hour, time.minute, 


time.second)) 


现在 有 两 种 方式 可 以 调用 print_time 。 第 一 种 (更 少见 的 ) 方 
式 是 使 用 函数 调用 语法 : 


>>> Time.print_time(start) 
09:45:00 


在 这 里 的 点 表示 法 中 ，Time 是 类 的 名 称 ， 而 print_time 古方 
法 的 名 称 。start 是 作为 参数 传 入 的 。 


男 一 种 (更 简洁 的 ) 方式 是 使 用 方法 调用 语法 : 


>>> start.print_ time ) 
09:45:00 


在 这 里 的 点 表示 法 中 ，print_time (又 一 次 ) 是 方法 的 名 称 ， 
而 start 是 调用 这 个 方法 的 对 象 ， 也 称 为 主体 (subject) 。 和 一 句 话 
中 主语 用 来 表示 这 人 句 话 是 关于 什么 东西 的 一 样 ， 方 法 调用 的 主体 表示 
这 个 方法 是 关于 哪个 对 象 的 。 


在 方法 中 ， 主 体会 被 赋值 给 第 一 个 形 参 ， 所 以 本 例 中 start 被 赋 


值 给 time 。 
依 惯例 来 ， 方 法 的 第 一 个 形 参 通常 叫 作 self ， 所 以 
print_time 通常 写成 这 样 的 形式 : 


class Time: 
def print_time(self): 
print('%.2d:%.2d:%.2d' % (self.hour, self.minute, 


self.second)) 


这 种 惯例 的 原因 是 一 个 隐喻 。 


。 芳 数 调用 的 语法 print_time(start ) 暗示 函数 是 活动 主体 。 它 
仿佛 在 说 : “ 喂 ，print_time ! 这 里 是 一 个 让 你 打印 的 对 象 。” 

。 在 面向 对 象 编 程 中 ， 对 象 是 活动 主体 。 类 似 
start.print_time() 的 方法 调用 相当 于 说 :“ 喂 ，start |! 
请 打印 你 自己 。” 


这 种 视角 的 改变 可 能 变 得 更 礼 狐 ， 但 是 否 也 更 有 用 这 一 点 却 不 那 
么 明显 。 在 我 们 已 经 见 过 的 例子 中 ， 它 也 许 并 没有 更 有 用 “。 但 有 时 候 


将 函数 的 责任 转 到 对 象 上 ， 使 我 们 能 够 编写 功能 更 丰富 的 函数 (或 方 
法 ) ， 也 使 代码 的 维护 和 复 用 更 容易 。 


作为 练习 ， 将 16.4 节 中 的 函数 time_to_int 重 写 为 方法 。 你 大 
概 也 会 想 将 int_to_time 重 写 为 方法 ， 但 这 么 做 实际 上 没有 什么 意 
义 ， 因 为 你 找 不 到 可 以 调用 它 的 对 象 。 


17.3 “ 另 一 个 示例 


下 面 是 函数 increment (参见 16.3 节 ) 的 另 一 个 重 写成 了 方法 的 
版 本 : 


# inside class Time: 


def increment(self, seconds): 


seconds += self.time to_int() 
return int_to_time(seconds) 


这 个 版 本 假设 time_to_int 已 经 写成 了 方法 。 另 外 ， 注 意 它 是 
一 个 纯 函 数 ， 而 不 是 一 个 修改 器 。 


下 面 是 调用 increment 的 方式 : 


>>> start.print time() 
09:45:00 
>>> end = start.increment(1337) 


>>> end.print_ time() 
10:07:17 


主体 start 赋值 给 第 一 个 形 参 selLf ， 实 参 1337 ， 赋 值 给 第 二 


个 形 参 seconds 。 


这 种 机 制 有 时 也 会 这 来 困惑 ， 尤 其 在 当 程序 出 错 的 时 候 。 例如， 
如 果 使 用 两 个 实 参 调用 increment ， 则 会 得 到 : 


>>> end = start.increment(1337, 460) 
TypeError: increment() takes 2 positional arguments but 3 were 


given 


错误 信息 初 看 起 来 似乎 很 令 人 困惑 ， 因 为 括号 里 只 有 两 个 实 参 。 
但 调用 的 主体 也 被 看 作 一 个 实 参 ， 所 以 其 实 总 共有 3 个 。 


另外 ， 按 位 实 参 (positional argument) 指 的 是 没有 指定 名 称 的 实 
参 ， 也 就 是 说 ， 它 不 是 一 个 关键 词 实 参 。 在 下 面 这 个 函数 调用 中 ， 
parrot 和 cage 是 按 位 实 参 ， 而 dead 是 一 个 天 键 词 实 参 : 


sketch(parrot, cage, dead=True) 


17.4 一 个 更 复杂 的 示例 


重 写 函 数 js_after 〈 见 16.1 节 ) 稍微 更 复杂 一 些 ， 因 为 它 接收 
两 个 Time 对 象 作为 形 参 。 这 种 情形 下 ， 依 惯例 ， 第 一 个 形 参 命名 为 
self ， 而 第 二 个 形 参 命名 为 other : 


# inside class Time: 


def is after(self, other): 


return self.time to_int() > other.time_ to_int() 


要 使 用 这 个 方法 ， 需 要 在 一 个 对 象 上 调用 它 ， 并 传 入 另 一 个 对 旬 
作为 实 参 ; 


>>> end.is after(start) 
True 


这 种 语法 的 一 个 好 处 是 ， 阅 读 起 来 几乎 和 英语 一 样 : “end is after 


start?” ° 


17.5 ”init 方法 


init 方法 ( 即 “initialization” 的 简写 ， 意 思 是 初始 化 是 一 个 特 
殊 方法 ， 当 对 象 初始 化 时 会 被 调用 。 它 的 全 名 是 init 《两 个 下 
划 线 ， 接 着 是 init ， 再 接着 两 个 下 划 线 ) 。Time 类 的 init 方法 可 
能 如 下 所 示 : 


# inside class Time: 


def _ init (self, hour=0, minute=0, second=0): 


self.hour = hour 
self.minute = minute 
self.second = second 


init _ 的 形 参 和 类 的 属性 名 称 党 第 是 相同 的 。 语 句 


self.hour = hour 


将 形 参 hour 的 值 存储 为 self 的 一 个 属性 。 


形 参 是 可 选 的 ， 所 以 当 你 不 使 用 任何 实 参 调用 Time 时 ， 会 得 到 
默认 值 : 


>>> time = Time() 
>>> time.print_time() 


00:00:00 


如 果 提 供 1 个 实 参 ， 它 会 履 荔 hour : 


>>> time = Time (9) 
>>> time.print time() 
09:00:00 


如 果 提 供 2 个 实 参 ， 它 会 窗 盖 hour 和 minute : 


>>> time = Time (9, 45) 
>>> time.print_time() 


09:45:00 


如 果 提 供 3 个 实 参 ， 它 们 会 窗 盖 全 部 3 个 默认 值 。 


作为 练习 ， 为 Point 类 编写 一 个 jnit 方法 ， 接 收 x 和 y 作为 可 
选 形 参 ， 并 将 它们 的 值 赋 到 对 应 的 属性 上 。 


17.6 ”str 方法 


_str 和 init 类似， 是 一 个 特殊 方法 ， 它 用 来 返回 对 象 
的 字符 串 表 达 形 式 。 


例如 ， 下 面 是 一 个 Time 对 象 的 str 方法 : 


# inside class Time: 


def _ str__(self): 


return '%.2d:%.2d:%.2d' % (self.hour, self.minute, 
self .second) 


当 你 打印 对 象 时 ，Python 会 调用 str 方法 。 


>>> time = Time(9, 45) 
>>> print(time) 


09:45:00 


当 我 编写 一 个 新 类 时 ， 我 忌 是 开始 先 写 init  ， 以 便 初 始 化 
对 象 ， 然 后 会 写 __str_  ， 以 便 调试 。 


作为 练习 ， 为 Point 类 编写 一 个 str 方法 。 创 建 一 个 Point 对 象 并 
打印 它 。 


17.7 “操作 符 重 载 


通过 定义 其 他 的 特殊 方法 ， 你 可 以 为 用 户 定 义 类 型 的 各 种 操作 符 
指定 行为 。 例 如 ， 如 果 你 为 Time 类 定义 一 个 _add_ 方法 ， 则 可 以 
在 Time 对 象 上 使 用 + 操作 符 。 


下 面 是 这 个 方法 的 定义 : 


# inside class Time: 


def _ add (self, other): 


seconds = self.time_ to_int() + other.time_ to_int() 
return int_to_time(seconds) 


而 下 面 是 如 何 使 用 它 : 


>>> Start = Time(9, 45) 
>>> duration = Time(1, 35) 
>>> print(start + duration) 


11:20:00 


当 你 对 Time 对 和 象 应 用 + 操作 符 时 ，Python 会 调用 add  。 当 你 
打印 结果 时 ，Python 会 调用 ”str  。 幕 后 其 实 发 生 了 很 多 事情 | 


修改 操作 符 的 行为 以 便 它 能 够 作用 于 用 户 定 义 类 型 ， 这 个 过 程 称 
为 操作 符 重 载 。 对 每 一 个 操作 符 ，Python 都 提供 了 一 个 对 应 的 特殊 方 
法 ， 如 _add  。 更 多 细节 ， 可 以 参见 


http://docs.python.org/3/reference/datamodel.html#specialnames ° 


作为 练习 ， 为 Point 类 编写 一 个 add 方法 。 


17.8 ”基于 类 型 的 分 发 


在 前 面 一 下 中 我 们 将 两 个 Time 对 象 相 加 ， 但 你 也 可 能 会 想 要 将 一 
个 Time 对 象 加 上 一 个 整数 。 接 下 来 是 _add_ ”的 一 个 版 本 ， 检 查 
other 的 类 型 ， 并 调用 add_time 或 increment : 


# inside class Time: 


def _ add (self, other): 
If isinstance(other, Time): 
return self.add time(other ) 
else: 
return self.increment(other) 


def add_ time(self, other): 
seconds = self.time to_ int() + other.time_ to_int() 


return int_to_time(seconds) 


def increment(self, seconds): 
seconds += self.time to_int() 
return int_to_time(seconds) 


内 置 印 数 ijsinstance 接收 一 个 值 与 一 个 类 对 象 ， 并 当 此 值 是 此 
类 的 一 个 实例 时 返回 True 。 


如 果 other 是 一 个 Time 对 象 ， add _ 会 调用 add_time。 否 
则 它 认 为 实 参 是 整数 ， 并 调用 increment 。 这 个 操作 称 为 基于 类 型 
的 分 发 〈type-based dispatch) ， 因 为 它 根据 形 参 的 类 型 ， 将 计算 分 发 
到 不 同 的 方法 上 。 


下 面 是 使 用 不 同类 型 的 实 参 调用 + 操作 符 的 示例 : 


>>> Start = Time(9，45) 

>>> duration = Time(1，35) 
>>> print(start + duration) 
11:20:00 


>>> print(start + 1337) 
10:07:17 


遗憾 的 是 ， 这 个 加 法 的 实现 并 不 满足 交换 律 。 如 果 整 数 古 第 一 个 
操作 数 ， 则 会 得 到 : 


>>> print(1337 + start) 
TypeError: unsupported operand type(s) for +: 'int' and ' instance'， 


问题 在 于 ， 这 里 和 之 前 询问 一 个 Time 对 象 加 上 一 个 整数 不 同 ， 
Python 在 询问 一 个 整数 去 加 上 一 个 Time 对 象 ， 而 它 并 不 知道 如 何 去 做 
到 。 但 这 个 问题 也 有 一 个 聪明 的 解决 方案 特别 方法 _radd ， 意 


即 “ 右 加 法 ” (right-side add) 。 当 Time 对 象 出 现在 + 号 的 右 侧 时 ， 会 调 
用 这 个 方法 。 下 面 是 它 的 定义 : 
# inside class Time 


def _radd_(self, other): 


return self. add (other) 


而 下 面 是 如 何 使 用 : 


>>> print(1337 + start) 
10:07:17 


作为 练习 ， 为 Point 类 编写 一 个 add 方法 ， 可 以 接收 一 个 Point 对 象 
或 者 一 个 元 组 。 


。 如 果 第 二 个 操作 对 象 是 一 个 Point 对 象 ， 则 方法 应 该 返回 一 个 新 的 
Point 对 象 ， 其 x 坐标 是 两 个 操作 对 象 的 x 坐标 的 和 ，y 坐标 也 是 类 
似 。 

。 如 采 第 二 个 操作 对 象 是 一 个 元 组 ， 方 法 则 将 第 一 个 元 素 和 x 坐标 
相 加 ， 将 第 二 个 元 素 和 y 坐标 相 加 ， 并 返回 一 个 包含 相 加 结果 的 
渐 Point 对 象 。 


17.9 多 态 


当 需 要 时 ， 基 于 类 型 的 分 发 很 有 用 ， 但 〈 邓 和 运 的 是 ) 我 们 并 不 总 
征 需 要 它 。 通 党 可 以 编写 函数 处 理 不 同类 型 的 参数 来 避免 它 。 


我 们 编写 的 很 多 处 理 字符 串 的 函数 ， 实 际 上 对 其 他 序列 类 型 也 可 
以 用 。 例 如 ， 在 11.1 节 中 ， 我 们 使 用 histogram 来 记录 单词 中 每 个 字 
母 出 现 的 次 数 : 


def histogram(s): 
d = dict() 
for c in s: 
if c not in d: 
d[c] = 1 


else: 
d[c] = d[c]+1L 
return d 


这 个 函数 对 列表 、 元 组 甚至 是 字典 都 可 用 ， 只 要 s 的 元 素 是 可 散 
列 的 ， 因 而 可 以 用 作 d 的 键 即 可 : 
>>> t = ['spam', 'egg', 'spam', 'spam', 'bacon', 'spam'] 


>>> histogram(t ) 
{'bacon': 1, 'egg': 1, 'spam': 4} 


人 处理 多 个 类 型 的 函数 称 为 多 态 (polymorphic) 。 多 态 可 以 促进 代 
码 复 用 。 例 如 ， 用 来 计算 一 个 序列 所 有 元 素 的 和 的 内 置 画 数 sum ， 对 
所 有 其 元 素 支 持 加 法 的 序列 都 可 用 。 


由 于 Time 对 象 提供 了 add 方法 ， 它 们 也 可 以 使 用 sum : 


Time(7, 43) 
Time(7, 41) 
Time(7, 37) 
total = sum([t1i, t2, t3]) 


print (total) 
23:01:00 


总 的 来 说 ， 如 采 男 数 内 部 所 有 的 操作 都 文 持 某 种 类 型 ， 那 么 这 个 
函数 殉 可 以 用 于 那 种 类 型 。 


当 你 发 现 一 个 写 好 的 函数 ， 竞 然 有 出 人 意料 的 效果 ， 可 以 用 于 没 
有 计划 过 的 类 型 时 ， 这 才 是 最 好 的 多 态 。 


17.10 ”接口 和 实现 


面 问 对 象 设计 的 目标 之 一 是 提 高 软件 的 可 维护 性 ， 也 就 是 说 ， 当 
系统 的 其 他 部 分 改变 时 ， 程 序 还 能 够 保持 正确 运行 ， 并 且 能 够 修改 程 
序 来 适应 新 的 需求 。 


将 接口 和 实现 分 离 的 设计 理念 ， 可 以 帮 我 们 更 容易 达到 这 个 目 
标 。 对 于 对 象 来 说 ， 那 意味 着 类 所 提供 的 方法 应 该 不 依赖 于 其 属性 的 
表达 万 起 


例如 ， 在 本 章 中 我 们 开发 了 一 个 类 来 表示 一 天 中 的 时 间 。 这 个 类 
提供 的 方法 包括 time_to_int、is after 和 add_ time 。 


我 们 可 以 使 用 几 种 不 同 的 方式 来 实现 这 些 方法 。 实 现 的 细节 依赖 
于 我 们 表达 时 间 概 念 的 方式 。 在 本 章 中 ，Time 对 象 的 属性 是 hour 、 


minute 和 second 。 

用 另 一 种 方案 ， 我 们 可 以 将 这 些 属性 替换 成 一 个 整数 ， 表 示 从 凌 
晨 开 始 到 现在 的 秒 数 。 这 种 实现 可 能 会 让 一 些 方法 ， 如 is_after ， 
更 容易 实现 ， 但 也 会 让 另 一 些 方法 更 难 实现 。 


在 部 车 一 个 新 类 时 ， 你 可 能 会 发 现 更 好 的 实现 。 如 果 程 序 中 其 他 
部 分 用 到 你 的 类 ， 则 修改 接口 会 非常 消耗 时 间 ， 并 且 容 易 产 生 错误 。 


但 是 ， 如 果 很 韶 慎 小 心地 设计 接口 ， 则 可 以 在 不 修改 接口 的 情 疫 
下 修改 实现 ， 这 样 程序 的 其 他 部 分 吏 不 需要 跟着 修改 。 


17.11 调试 


在 程序 运行 的 任何 时 刻 ， 往 对 象 上 添加 属性 都 是 合法 的 ， 但 如 果 
遵守 更 疗 格 的 类 型 理论 ， 让 对 象 拥 有 相同 的 类 型 却 有 不 同 的 属性 组 ， 
会 很 容易 导致 错误 。 通 党 来 说 ， 在 init 方法 中 初始 化 对 象 的 全 部 属 


是 个 好 习惯 。 
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如 果 并 不 清楚 一 个 对 象 是 否 拥 有 某 个 属性 ， 可 以 使 用 内 置 画 数 
hasattr (参见 15.7 节 ) 。 


男 一 种 访问 一 个 对 象 的 属性 的 方法 是 使 用 内 置 画 数 vars ， 它 接 


收 一 个 对 象 ， 并 返回 一 个 将 属性 名 称 (字符 串 形 式 ) 映射 到 属性 值 的 
字典 对 象 : 


>>> p = Point(3, 4) 
>>> Vars(p) 


{'y': 4, 'x': 3} 


为 了 调试 ， 你 可 能 会 发 现 将 这 个 函数 放 在 手边 是 很 有 用 的 : 


def print_attributes(obj ) : 
for attr in vars(obj ) : 


print (attr, getattr(obj, attr)) 


print_attributes 遇 历 对 象 的 属性 字典 ， 并 打印 出 每 个 属性 
的 名 称 和 相应 的 值 。 


内 置 函 数 getattr 接收 一 个 对 象 以 及 一 个 属性 名 称 〈 字 符 串 形 
式 ) 并 返回 属性 的 值 。 


17.12 ”术语 表 


面向 对 象 语言 (object-oriented language) : 一 种 提供 诸如 用 户 定 
义 类 型 和 方法 之 类 的 语言 特性 ， 以 方便 面向 对 象 编程 的 语言 。 


面 癌 对 象 编程 (object-oriented programming) : 一 种 编程 风格 ， 
数据 和 修改 数据 的 操作 组 织 成 类 和 方法 的 形式 。 


方法 (method) : 在 类 定义 之 内 定义 的 函数 ， 在 类 的 实例 上 调 
用 。 


主体 (subject) : 调用 方法 所 在 的 对 象 。 


按 位 实 参 (positional argument) : 一 个 不 包含 参数 名 字 的 实 参 ， 
所 以 它 不 是 一 个 关键 词 实 参 。 


操作 符 重 载 (operator overloading) : 修改 一 个 类 似 + 号 这 样 的 探 
作 符 的 行为 ， 使 之 可 以 用 于 用 户 定义 类 型 。 


基于 类 型 的 分 发 \type-based dispatch) : 一 种 编程 模式 ， 检 查 操 
作对 象 的 类 型 ， 并 对 不 同类 型 调用 不 同 的 函数 。 


多 态 (polymorphic) : 函数 的 一 种 属性 ， 可 以 处 理 多 种 类 型 的 参 


言 息 隐藏 (information hiding) : 对 象 提供 的 接口 不 应 当 依 赖 于 
其 实现 ， 特 别 是 其 属性 的 表达 形式 的 原则 。 


17.13 ”练习 


练习 17-1 


从 http://thinkpython2.com/code/Time2.py 下 载 本 章 的 代码 。 将 
Time 的 属性 改 为 从 次 晨 开 始 到 现在 的 秒 数 。 接 着 修改 方法 (以 及 画 
数 int_to_time) ， 以 适应 新 的 属性 实现 。 你 应 该 不 需要 修改 main 
里 面 的 测试 代码 。 当 你 做 完 之 后 ， 输 出 应 该 和 以 前 一 样 。 


解答 : http://thinkpython2.com/code/Time2_soln.py 
练习 17-2 


这 个 练习 提醒 你 关于 Python 的 一 种 最 常见 且 最 难 碍 找 的 错误 的 故 


编写 一 个 叫 作 Kangaroo 《袋鼠 ) 的 类 ， 有 如 下 方法 。 


1. 一 个 _init_ 方法， 将 属性 pouch_contents (口袋 中 的 
东西 ) 初始 化 为 一 个 空 列表 。 


2. 一 个 put_in_pouch 方法 ， 接 收 任何 类 型 的 对 象 ， 并 将 它 添 
加 到 pouch_contents 中 。 


3. 一 个 _str_ 方法， 返回 Kangaroo 对 象 以 及 口袋 中 的 内 容 的 
要 


创建 两 个 Kangaroo 对 象 ， 将 它们 赋值 到 变量 kanga 和 roo ， 并 
将 roo 添加 到 kanga 的 口袋 中 。 


下 载 http:/thinkpython.com/code/BadKangaroo.py， 它 
题 的 解答 ， 但 里 面 有 一 个 很 大 很 丑陋 的 pug。 找 出 并 修复 


包含 了 前 面 问 
这 


个 bug。 


如 果 你 直到 阻碍 ， 可 以 下 载 
http://thinkpython.com/code/GoodKangaroo.py， 它 解释 了 问题 的 原因 ， 
并 提供 了 一 个 解决 方案 。 


第 18 章 ”继承 


和 面向 对 象 编 程 最 常 相 关 的 语言 特性 就 是 继承 (inheritance ) 。 
继承 指 的 是 根据 一 个 现 有 的 类 型 ， 定 义 一 个 修改 版 本 的 新 类 的 能 
本 章 中 我 会 使 用 几 个 类 来 表达 扑克 牌 、 牌 组 以 及 扑克 牌 型 ， 用 于 展示 
继承 特性 。 


如 果 你 不 玩 扑 克 ， 可 以 在 http:Wen.wikipedia.org/wiki/Poker 里 阅读 相 
天 介绍 ， 但 其 实 并 不 必要 ;我 会 在 书 中 介绍 练习 中 所 需 知 道 的 东西 。 


本 章 的 代码 示例 可 以 从 http://thinkpython2.com/code/Card.py 下 载 。 


18.1 卡片 对 象 


一 副 牌 里 有 52 张 牌 ， 共 有 4 个 人 花色， 每 种 花色 13 张 ， 大 小 各 不 相 
同 。 花 色 有 黑 桃 《Spade) 、 红 桃 (Heart) 、 方 片 (Diamond) 和 草花 
(Club) 《在 桥牌 中 ， 这 几 个 花色 是 降序 排列 的 ) 。 每 种 花色 的 13 张 
牌 分 别 为 : Ace、2、3、4、5、6、7、8、9、10、Jack、Queen 和 
King。 根 据 你 玩 的 不 同 游戏 ，Ace 可 能 比 King 大 ， 也 可 能 比 2 小 。 


如 果 我 们 定义 一 个 新 对 象 来 表示 卡 牌 ， 则 其 属性 显然 应 该 是 rank 
(大 小 ) 和 suit (花色 ) 。 但 属性 的 值 就 不 那么 直观 了 。 一 种 可 能 是 
使 用 字符 串 ， 例 如 ， 用 'Spade' 表示 花色 ， 用 "Queen ' 表示 大 小 。 
这 种 实现 的 问题 之 一 是 比较 大 小 和 花色 的 高 低 时 会 比较 困难 。 


男 一 种 方案 是 使 用 整数 来 给 大 小 和 花色 编码 。 在 这 个 语 境 中 ，“ 编 
码 "意味 着 我 们 要 定义 一 个 数字 到 花色， 或 者 数字 到 大 小 的 映射 。 这 种 
编码 并 不 意味 着 它 是 秘密 (那样 就 应 该 称 为 “加 密 ” 了 ) 。 


例如 ， 下 表 展 示 了 伦 色 和 对 应 的 整数 编码 : 


这 个 编码 令 我 们 可 以 很 容易 地 比较 卡 牌 ， 因 为 更 大 的 人 花色 映射 到 


更 大 的 数字 上 ， 我 们 可 以 直接 使 用 编码 来 比较 花色 。 


卡 牌 大 小 的 映射 相当 明显 ;每 个 数字 形式 的 大 小 映 冉 到 相应 的 整 
数 上 ， 而 对 于 花 牌 : 


我 使 用 "一 ”符号 ， 是 为 了 说 明 这 些 轴 射 并 不 是 Python 程序 的 一 部 
分 。 它 们 是 程序 设计 的 一 部 分 ， 但 并 不 在 代码 中 直接 表现 。 


Card 类 的 定义 如 下 : 


class Card: 
"""Represents a standard playing card."™""" 


def _ _init_ _(self, suit=0, rank=2): 


self.suit = suit 
self.rank = rank 


和 前 面 一 样 ，init 方法 对 每 个 属性 定义 一 个 可 选 形 参 。 默 认 的 卡 
牌 古 草 化 2。 


要 创建 一 个 Card 对 象 ， 使 用 你 想 要 的 花色 和 大 小 调用 Card : 


18.2 类 属性 
为 了 能 将 Card 对 象 打印 成 人 们 容易 阅读 的 格式 ， 我 们 需要 将 整数 


编码 映 冉 成 对 应 的 大 小 和 人 花色。 日 然 的 做 法 是 使 用 字符 串 列表 。 我 们 
将 这 些 列表 赋 到 类 属性 上 : 


# 在 Card 类 里 : 


suit_names ['Clubs', 'Diamonds', 'Hearts', 'Spades'] 
rank_names [None, 'Ace', '2', '3', '4', '5', '6', '7' 
ne! 1 


了 
9', '10', 'Jack'，'Queen'， 'King'] 


def _ _str_ _(self): 
return '%s of %s' % (Card.rank_names[self.rank], 
Card.suit_names[self.suit]) 


suit_names 和 rank_names 这 样 的 变量 ， 定 义 在 类 之 中 ， 但 在 
任何 方法 之 外 ， 我 们 称 为 类 属性 。 因 为 它们 是 和 类 对 象 Card 相关 联 
的 。 


这 个 术语 和 suit 与 rank 之 类 的 变量 相 区 别 。 那 些 称 为 实例 属性 
， 因 为 它们 是 和 一 个 特定 的 实例 相关 联 的 。 


两 种 属性 都 使 用 句点 表示 法 访问 。 例 如 , 在 _str _ 中，self 是 
一 个 Card 对 象 ， 而 self.rank 是 它 的 大 小 。 相 似 地 ，Card 是 一 个 类 
对 象 ， 而 Card ,rank_names 是 关联 到 这 个 类 的 一 个 字符 串 列 表 。 


每 个 卡片 都 有 它 自己 的 suit 和 rank ， 但 总 共 只 有 一 个 


suit_names 和 rank_names 。 


综合 起 来 ， 表 达 式 Card .rank_names[self.rank] 意思 是 “使 
用 对 象 self 的 属性 rank 作为 索引 ， 从 类 Card 的 列表 rank_names 
中 选择 对 应 的 字符 串 ”。 


rank_names 的 第 一 个 元 素 是 None ， 因 为 没有 大 小 为 0 的 卡 牌 。 
因为 使 用 None 占据 了 一 个 位 置 ， 我 们 就 可 以 得 到 从 下 标 2 到 字符 
串 '2' 这 样 整齐 的 映射 。 如 果 要 避免 这 种 操作 ， 可 以 使 用 字典 而 不 是 
列表 。 


利用 现 有 的 方法 ， 可 以 创建 并 打印 卡 牌 : 


>>> Card1 = Card(2, 11) 
>>> print(card1) 
Jack of Hearts 


图 18-1 展 示 了 Card 类 对 象 和 一 个 Card 实 例 。Card 是 一 个 类 对 
象 ， 所 以 它 的 类 型 是 type 。card1 的 类 型 是 card 。 为 了 节省 空间 ， 
我 没有 画 出 suit_names 和 rank_names 的 内 容 。 
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图 18-1 对象 图 


18.3 对比 卡 牌 


对 于 内 置 类 型 ， 我 们 用 比较 操作 符 (<、>、== 等 ) 来 比较 对 象 
并 决定 哪 一 个 更 大 、 更 小 或 者 相等 。 对 于 用 户 定义 类 型 ， 我 们 可 以 通 
过 提供 一 个 方法 _1t _， 代 表 "“less than”, 来 重 载 内 置 操 作 符 的 行为 。 


_1t _ 接收 两 个 形 参 ，self 和 other ， 当 第 一 个 对 象 严格 小 于 
第 二 个 对 象 时 返回 True 。 


卡 牌 的 正确 顺序 并 不 显而易见 。 例 如 ， 草 花 3 和 方 刻 2 哪 个 更 大 ? 
一 个 牌 面 数 大 ， 男 一 个 花色 大 。 为 了 比较 卡 脾 ， 需 要 决定 大 小 和 花色 
哪个 更 重要 。 


这 个 问题 的 答案 取决 于 你 在 玩 哪 种 牌 类 游戏 ， 但 为 了 简单 起 见 ， 
我 们 随意 做 一 个 决定 ， 认 为 花色 更 重要 ， 于 是 ， 所 有 的 黑 桃 比 所 有 的 
方 片 都 大 ， 依 此 类 推 。 


这 一 扩 决 定 后 ， 我 们 束 可 以 编写 _1t 函数: 


# 在 Card 类 里 : 


if self.suit < other.suit: return True 
if self.suit > other.suit: return False 


# 化 色相 同 ， 检 查 大 小 


return self.rank < other .rank 


使 用 元 组 比较 ， 可 以 写 得 更 紧 旋 : 


# 在 Card 类 里 : 


def 1t (self, other): 


t1 = self.suit, self.rank 
t2 = other.suit, other.rank 
return ti < 七 2 


作为 练习 ， 为 时 间 对 象 编写 一 个 _1t 方法。 你 可 以 使 用 元 组 比 
较 ， 也 可 以 考虑 使 用 整数 比较 。 


18.4 ”有 牌 组 


现在 我 们 已 经 有 了 卡 牌 〈card) ， 下 一 步 就 是 定义 牌 组 (deck) 
由 于 牌 组 是 由 卡 牌 组 成 的 ， 很 目 然 地 ， 每 个 Deck 对 象 应 该 有 一 个 属性 
包含 卡 牌 的 列表 。 


下 面 是 Deck 的 类 定义 。init 方法 创建 cards 属性 ， 并 生成 52 张 
牌 的 标准 牌 组 : 


class Deck : 


def _ _init_ _(self): 


self.cards = [] 
for suit in range(4): 
for rank in range(1, 14): 
card = Card(suit, rank) 
self.cards.append(card) 


填充 牌 组 最 简单 的 办 法 是 使 用 肉 套 循环 。 外 层 循环 从 0 到 3 遍历 各 
个 花色 。 内 层 循环 从 1 到 13 遍 历 卡 牌 大 小 。 每 次 迭代 使 用 当前 的 花色 和 
大 小 创建 一 个 新 的 Card 对 象 ， 并 将 它 添 加 到 self.cards 中 。 


18.5 ”打印 牌 组 


下 面 是 Deck 的 一 个 __str_ _ 方法 : 


# 在 Deck 类 里 : 


def __str__(self): 
res=[] 


for card in self.cards: 
res.append(str(card)) 
return '\n'.join(res) 


这 个 方法 展示 了 一 种 累积 构建 大 字符 串 的 方法 ， 先 构建 一 个 字符 
串 的 列表 ， 再 使 用 字符 串 方法 join 。 内 置 画 数 str 会 对 每 个 卡 牌 对 象 
调用 _ str_ ”方法 并 返回 字符 串 表达 形式 。 


由 于 我 们 对 一 个 换行 符 调 用 join 函数 ， 卡 片 之 间 用 换行 分 隔 。 下 
面 是 打印 的 结 采 : 


>>> deck = Deck() 
>>> print(deck) 
Ace of Clubs 

2 of Clubs 


3 of Clubs 


10 of Spades 

Jack of Spades 
Queen of Spades 
King of Spades 


虽然 结果 显示 了 52 行 ， 它 仍然 是 一 个 包含 换行 符 的 字符 串 。 
18.6 添加、 删除 、 洗 牌 和 排序 


为 了 能 够 发 牌 ， 我 们 需要 一 个 方法 从 牌 组 中 抽取 一 张 牌 并 返回 。 
列表 方法 pop 为 此 提供 了 一 个 方便 的 功能 : 


# 在 Deck 类 里 : 


def pop_card(self): 
return self.cards.pop() 


由 于 pop 从 列表 中 抽出 最 后 一 张 牌 ， 我 们 其 实 是 从 牌 组 的 瓜 剖 发 
牌 的 。 


要 添 加 一 个 卡 牌 ， 我 们 可 以 使 用 列表 方法 append : 


# 在 Deck 类 里 : 


def add_card(self, card): 


self.cards.append(card) 


像 这 样 调用 男 一 个 方法 ， 却 不 做 其 他 更 多 工作 的 方法 ， 有 了 时候 称 
为 一 个 饰 面 (veneer) 。 这 个 比喻 来 自 于 木工 行业 ， 在 木工 行业 中 饰 
面 是 为 了 改天 外 观 而 粘贴 到 便宜 的 木料 表面 的 薄 薄 的 一 层 优质 木料 。 


在 这 个 例子 里 ，add_card 十 一 个 “ 薄 注 ”的 方法 ， 用 更 适合 牌 组 
的 术语 来 表达 一 个 列表 操作 。 它 改善 了 实现 的 外 观 (或 接口 ) 。 


作为 另 一 个 示例 ， 我 们 可 以 使 用 random 模块 的 函数 shuffle 来 
编写 一 个 Deck 方 法 shuffle ( 洗 牌 ) : 


# 在 Deck 类 里 : 


def shuffle(self): 


random. shuffle(self.cards) 


不 要 忘记 导入 random 模块 。 


作为 练习 ， 编 写 一 个 Deck 方 法 sort ， 使 用 列表 方法 sort 来 对 一 
个 Deck 中 的 卡 牌 进行 排序 。sort 使 用 我 们 定义 的 _1t _ 方法 来 决定 
顺序 。 


18.7 ”继承 


继承 是 一 种 能 够 定义 一 个 新 类 对 现 有 的 某 个 类 稍 作 修改 的 语言 特 
性 。 作 为 示例 ， 假 设 我 们 想 要 一 个 类 来 表达 一 副 “ 手 牌 "， 即 玩家 手 握 
的 一 副 牧 。 一 副手 牌 和 一 友和 脾 组 相似 ， 都 是 由 卡 牌 的 集合 组 成 ， 并 且 
都 需要 诸如 增加 和 移 除 卡 牌 的 操作 。 


一 副手 牌 和 一 套 牌 组 也 有 区 别 ， 我 们 期 望 手 牌 拥有 的 一 些 操 作 ， 
对 牌 组 来 说 并 无 意义 。 例 如 ， 在 扑 死 牌 中 ， 我 们 可 能 想 要 比较 两 副手 
牌 来 判断 谁 获 胜 了 。 在 桥牌 中 ， 我 们 可 能 需要 为 一 副手 牌 计算 分 数 以 
叫 脾 。 


这 种 类 之 间 的 天 系 一 一 相似 ， 但 不 相同 一 一 让 它 成 为 继承 。 要 定 
义 一 个 继承 现 有 类 的 新 类 ， 可 以 把 现 有 类 的 名 称 放 在 括号 之 中 : 


class Hand(Deck ) : 
"""Represents a hand of playing cards ,""" 


这 个 定义 说 明 Hand 从 Deck 继承 而 来 ， 这 意味 着 我 们 可 以 像 Deck 
对 象 那 样 在 Hand 对 象 上 使 用 pop_card 和 add_card 方法 。 


当 新 类 继承 现 有 类 时 ， 现 有 的 类 被 称 为 父 类 (parent) ， 而 新 类 则 
称 为 子 类 (child) 。 


在 本 例 中 ，Hand 也 会 继承 Deck 的 ”init 方法 ， 但 它 和 我 们 
想 要 的 并 不 一 样 : 我 们 不 需要 填充 52 张 卡 牌 ，Hand 的 init 方法 应 当初 
台 化 cards 为 一 个 空 列 表 。 


如 果 我 们 为 Hand 类 提供 一 个 init 方法 ， 它 会 覆盖 Deck 类 的 方 


# 在 Hand 类 里 : 


def _ _init_  _(self, lable="''): 


self .cards 


[] 
self.1label Jabel 


在 创建 Hand 对 象 时 ，Python 会 调用 这 个 init 方法 而 不 是 Deck 中 
的 那个 : 
>>> hand = Hand(' new hand ' ) 
>>> hand.cards 


>>> hand.1label 
new hand ' 


其 他 的 方法 是 从 Deck 中 继承 而 来 的 ， 所 以 我 们 可 以 使 用 
pop_card 和 add_card 来 出 牌 : 


>>> deck = Deck() 

>>> card = deck.pop_card() 
>>> hand.add_card(card) 
>>> print(hand) 

King of Spades 


下 一 步 很 目 然 地 束 是 将 这 段 代 码 封 小 起 来 成 为 一 个 方法 


move_cards : 


# 在 Deck 类 里 : 


def move_cards(self, hand, num): 


for i in range(num): 
hand.add_card(self .pop_card()) 


move_cards 接收 两 个 参数 ， 一 个 Hand 对 象 以 及 需要 出 牌 的 牌 
数 。 它 会 修改 self 和 hand ， 返 回 None 。 


有 的 情况 下 ， 卡 牌 会 从 一 副手 牌 中 移 除 转 入 到 另 一 幅 手 牌 中 ， 或 
者 从 手 牌 中 回 到 牌 组 。 你 可 以 使 用 move_cards 来 处 理 全 部 这 些 操 
作 : self 既 可 以 是 一 个 Deck 对 象 ， 也 可 以 是 一 个 Hand 对 象 。 而 hand 
参数 ， 虽 然 名 字 是 hand ， 却 也 可 以 是 一 个 Deck 对 象 。 


继承 是 很 有 用 的 语言 特性 。 有 些 程序 不 用 继承 写 ， 会 有 很 多 重复 
代码 ， 使 用 继承 后 就 会 更 加 优雅 。 继 承 也 能 促进 代码 复 用 ， 因 为 你 可 
以 在 不 修改 父 类 的 前 提 下 对 它 的 行为 进行 定制 化 。 有 的 情况 下 ， 继 承 
结构 反映 了 问题 的 目 然 结构 ， 所 以 也 让 设计 更 容易 理解 。 


但 男 一 方面 ， 继 承 也 可 能 会 让 代码 更 难 读 。 有 了 时 候 当 一 个 方法 被 
调用 时 ， 并 不 清楚 到 哪里 能 找到 它 的 定义 。 相 关 的 代码 可 能 散布 在 几 
个 不 同 的 模块 中 。 并 且 ， 很 多 可 以 用 继承 实现 的 功能 ， 也 能 不 用 它 实 
现 ， 甚 至 可 以 实现 得 更 好 。 


18.8 ”类 图 


至 此 我 们 已 见 过 用 于 显示 程序 状态 的 栈 图 ， 以 及 用 于 显示 对 象 的 
属性 和 属性 值 的 对 象 图 。 这 些 图 表 展 示 了 程序 运行 中 的 一 个 快照 ， 所 
以 当 程 序 继续 运行 时 它们 会 跟着 改变 。 


它们 也 极其 详细 ; 在 某 些 情况 下 ， 是 过 于 详细 了 。 而 类 图 对 程序 
结构 的 展示 相对 来 说 更 加 抽象 。 它 不 会 具体 显示 每 个 对 象 ， 而 是 显示 
各 个 类 以 及 它们 之 间 的 关联 。 


类 之 间 有 下 面 几 种 关联 。 


一 个 类 的 对 象 可 能 包含 其 他 类 的 对 象 的 引用 。 例 如 ， 每 个 
Rectangle 对 象 都 包含 一 个 到 Point 对 象 的 引用 ， 而 每 一 个 Deck 对 象 
包含 到 很 多 Card 对 象 的 引用 。 这 种 关联 称 为 HAS-A (有 一 个 ) ， 
也 就 是 说 , “矩形 (Rectangle) 中 有 一 个 点 (Point) ” 

一 个 类 可 能 继承 自 另 一 个 类 。 这 种 关系 称 为 TS-A (是 一 个 ) ， 也 
就 是 说 , “一 副手 牌 (Hand) 是 一 个 牌 组 (Deck) ” 

一 个 类 可 能 依赖 于 另 一 个 类 ， 也 就 是 说 ， 一 个 类 的 对 象 接收 另 一 
个 类 的 对 象 作为 参数 ， 或 者 使 用 另 一 个 类 的 对 象 来 进行 某 种 计 
算 。 这 种 关系 称 为 依赖 (dependency) 。 


类 图 用 图 形 展 示 了 这 些 关 系 。 例 如 ， 图 18-2 展 示 了 Card 、Deck 
和 Hand 之 间 的 关系 。 


图 18-2 类 图 


至 心 三 角形 箭头 的 线 代 表 着 一 个 IS-A 关 系 ; 这 里 表示 Hand 是 继承 
目 Deck 的 。 


标准 的 箭头 表示 HAS-A 关 系 ; 这 里 表示 Deck 对 象 中 有 到 Card 对 象 
的 引用 。 


箭头 附近 的 星 号 ( 淡 ) 表示 是 关联 重 数 标记 ， 它 表示 Deck 中 有 多 
少 Cards。 这 个 数 可 以 是 一 个 简单 的 数字 ， 如 52 ， 或 者 一 个 范围 ， 如 
5, .7 ， 或 者 一 个 星 号 ， 表 示 Deck 可 以 有 任意 数量 的 Card 引 用 。 


图 18-2 中 没有 任何 依赖 关系 。 依 赖 关 通常 使 用 虚线 节 头 表示 。 或 
者 ， 如 果 有 太 多 的 依赖 ， 有 时 候 会 忽略 它们 。 


更 详细 的 图 可 能 会 显示 出 Deck 对 象 实 际 上 包含 了 一 个 Card 的 列表 
° 但 在 类 图 中 ， 像 列表 、 字 典 这 样 的 内 置 类 型 通常 是 不 显示 的 。 


18.9 ”数据 封装 


前 儿童 展示 了 一 个 我 们 可 以 称 为 “面向 对 象 设计 ”的 开发 计划 。 我 
们 发 现 需 要 的 对 象 ， 如 Point 、Rectangle 和 Time， 并 定义 类 来 表 
达 它 们 。 每 个 类 都 是 一 个 对 象 到 现实 世界 (或 者 最 少 是 数学 世界 ) 中 
的 某 种 实体 的 明显 对 应 。 


但 有 时 候 你 到 底 需 要 哪些 对 象 、 它 们 如 何 交 互 ， 并 不 那么 显 而 易 
见 。 这 时 候 你 需要 另 一 种 开发 计划 。 和 之 前 我 们 通过 封装 和 泛 化 来 发 
现 函 数 接口 的 方式 相同 ， 我 们 可 以 通过 数据 封装 来 发 现 类 的 接口 。 


13.8 节 提供 了 一 个 很 好 的 示例 。 如 果 从 
http://thinkpython2.com/code/markov.py 下 载 我 的 代码 ， 你 会 发 现 它 使 用 


一 


了 两 个 全 局 变量 (suffix_map 和 prefix ) 并 且 在 多 个 函数 中 进行 


suffix_map = {} 
prefix = () 


因为 这 些 变 量 是 全 局 的 ， 我 们 每 次 只 能 运行 一 个 分 析 。 如 末 我 们 
读 入 两 个 文本 ， 它 们 的 前 级 和 后 弘 束 会 添加 到 相同 的 数据 结构 中 (最 
后 可 以 用 来 产生 一 些 有 趣 的 文本 ) 。 


铬 要 多 次 运行 分 析 ， 并 保证 它们 之 间 的 独立 ， 我 们 可 以 将 每 次 分 
析 的 状态 信息 封装 成 一 个 对 象 。 下 面 是 它 的 样子 : 


class Markov: 


def __ init _(self): 


self.suffix_ map = {} 
self.prefix = () 


接 下 来 ， 我 们 将 那些 函数 转换 为 方法 。 例 如 ， 下 面 是 


procesSs_word : 


def process word(self, word, order=2): 
if len(self.prefix) < order: 
self.prefix += (word,) 
return 


try: 
self.suffix_map[self.prefix].append(word) 
except KeyError: 
# 如 果 这 个 前 缀 不 存在 ， 创 建 一 项 
self.suffix_map[self.prefix] = [word] 


self.prefix = shift(self.prefix, word) 


像 这 样 转换 程序 一 一 修改 设计 但 不 修改 其 行为 一 一 是 重 构 (参见 


4.7 广 ) 的 男 一 个 示例 。 


这 个 例子 给 出 了 一 个 设计 对 象 和 方法 的 开发 计划 。 


1， 从 编写 国 数 、 (如 采 需 要 的 话 ) 读 写 全 局 变量 开始 。 


2. 一 旦 你 的 程序 能 够 正确 运行 ， 查 看 全 局 变量 与 使 用 它们 的 函数 
的 关联 。 


3. 将 相关 的 变量 封装 成 为 对 象 的 属性 。 
4. 将 相关 的 函数 转换 为 这 个 新 类 的 方法 。 


作为 练习 ， 从 http://thinkpython2.com/code/markov.py 下 载 我 的 
Markov 代 码 ， 并 按照 上 面 摘 述 的 步 又 将 全 局 变量 封装 为 一 个 叫 作 
Markov 的 新 类 的 属性 。 


解答 :http://thinkpython2.com/code/Markov.py (注意 M 是 大 写 
的 ) 。 


18.10 ”调试 


继承 会 给 调试 带 来 新 的 挑战 ， 因 为 当 你 调用 对 象 的 方法 时 ， 可 能 
无 法 知道 调用 的 到 抵 是 哪个 方法 。 


假设 你 在 编写 一 个 操作 Hand 对 象 的 函数 。 你 可 能 希望 能 够 处 理 所 
有 类 型 的 Hand， 如 PokerHands、BridgeHands 等 。 如 果 你 调用 一 个 方 


法 ， 如 shuffle ， 可 能 调用 的 是 Deck 中 定义 的 方法 ， 但 如 果 任 何 子 
类 重 载 了 这 个 方法 ， 则 你 调用 的 会 是 那个 重 载 的 版 本 。 


一 旦 你 无 法 确认 程序 的 运行 流程 ， 最 简单 的 解决 办 法 是 在 相关 的 
方法 开头 添加 一 个 打印 语句 。 如 果 Deck .shuffle 打印 一 句 Running 
Deck. shuffle 这 样 的 信息 ， 则 当 程序 运行 时 会 跟踪 运行 的 流程 。 


或 者 ， 你 也 可 以 使 用 下 面 这 个 画 数 。 它 接收 一 个 对 象 和 一 个 方法 
名 (字符 串 形 式 ) ， 并 返回 提供 这 个 方法 的 定义 的 类 ， 


def find_defining_class(obj，meth_name ) : 


for ty in type(obj).mro(): 
If meth_name in ty. _ _dict_  _: 
return ty 


下 面 是 使 用 的 示例 : 


>>> hand = Hand() 
>>> find_defining_class(hand, 'shuffle') 


<class 'Card.Deck'> 


所 以 这 个 Hand 对 象 的 shuffle 方法 是 在 Deck 类 中 定义 的 那个 。 


find_defining_class 使 用 mro 方法 来 获得 用 于 搜索 调用 方法 
的 类 对 象 (类 型 ) 列表 。“MRO” 意 思 是 “method resolution order” (方法 
查找 顺序 ) ， 是 Python 解析 方法 名 称 的 时 候 搜 索 的 类 的 顺序 。 


一 个 设计 建议 ， 每 次 重 载 一 个 方法 时 ， 新 方法 的 接口 应 当 和 旧 方 
法 的 一 致 。 它 应 当 接 收 相同 的 参数 ， 返 回 相 同 的 类 型 ， 并 服从 同样 的 
前 置 条 件 与 后 置 条 件 。 如 采 这 循 这 个 规则 ， 你 会 发 现任 何 为 如 Deck 这 


样 的 父 类 设计 的 函数 ， 都 可 以 使 用 Hand 或 PokerHand 这 样 的 子 类 的 实 
例 。 


如 有 条 你 破坏 这 个 也 称 为 “Liskov 蔡 代 原 则 ”的 规则 ， 你 的 代码 可 能 会 
像 一 堆 (不 好 意思 ) 纸牌 屋 一 样 朋 塌 。 


18.11 术语 表 


编码 (encode) ， 使 用 一 个 集合 的 值 来 表示 另 一 个 集合 的 值 ， 需 
要 在 它们 之 间 建 立 映射 。 


类 属性 ” (class attribute) : 关联 到 类 对 象 上 的 属性 。 类 属性 定义 在 
类 定义 之 中 ， 但 在 所 有 方法 定义 之 外 。 


实例 属性 (instance attribute) : 和 类 的 实例 关联 的 属性 。 


饰 面 (veneer) : 一 个 方法 或 画 数 ， 它 调用 另 一 个 男 数 ， 却 不 做 
其 他 计算 ， 只 是 为 了 提供 不 同 的 接口 。 


继承 (inheritance) : 可 以 定义 一 个 新 类 ， 它 是 一 个 现 有 的 类 的 修 
改版 本 。 


父 类 (parent class) : 被 子 类 所 继承 的 类 。 


子 类 (child class) : 通过 继承 一 个 现 有 的 类 来 创建 的 新 类 ， 也 叫 
作 “subclass”。 


IS-A 关 联 (IS-A relationship) : 子 类 与 父 类 之 间 的 关联 。 


HAS-A 关 联 (HAS-A relationship) : 两 个 类 之 间 的 一 种 关联 : 一 
个 类 包含 另 一 个 类 的 对 象 的 引用 。 


依赖 (dependency) : 两 个 类 之 间 的 一 种 关联 。 一 个 类 的 实例 使 
用 另 一 个 类 的 实例 ， 但 不 把 它们 作为 属性 存储 起 来 。 


类 图 (class diagram) : 用 来 展示 程序 中 的 类 以 及 它们 之 间 的 关联 
的 图 。 


重 数 (multiplicity) : 类 图 中 的 一 种 标记 方法 ， 对 于 HAS-A 关 
联 ， 用 来 表示 一 个 类 中 有 多 少 对 另 一 个 类 的 对 象 的 引用 。 


数据 封装 (data encapsulation) : 一 个 程序 开发 计划 。 先 使 用 全 局 
变量 来 进行 原型 设计 ， 然 后 将 全 局 变量 转换 为 实例 属性 做 出 最 终 版 
未 5 


18.12 ”练习 


练习 18-1 


针对 下 面 的 程序 ， 画 一 张 UML 类 图 ， 展 示 这 些 类 以 及 它们 之 间 的 
天 联 : 


class PingPongParent : 
pass 


class Ping(PingPongParent ) : 
def init_ (Self，pong) : 
self.pong = pong 


class Pong(PingPongParent ) : 
def _ init_ _ (self，pings=None ) : 
If pings is None : 


self.pings = [] 
else: 
self.pings = pings 


def add_ping(self, ping): 
self.pings.append(ping) 


pong = Pong() 
ping = Ping(pong) 
pong.add_ping(ping) 


练习 18-2 


编写 一 个 名 为 deal_hands 的 Deck 方 法 ， 接 收 两 个 形 参 : 手 牌 的 
数量 以 及 每 副手 牌 的 牌 数 。 它 会 根据 形 参 创建 新 的 Hand 对 象 ， 按 照 每 
副手 牌 的 牌 数 出 牌 ， 并 返回 一 个 Hand 对 和 象 列 表 。 


练习 18-3 


下 面 列 出 的 是 扑 殉 牌 中 可 能 的 手 牌 ， 按 照 牌 值 大 小 的 增 序 (也 是 
可 能 性 的 降序 ) 排列 。 


。 对 子 (pair) : 两 张 牌 大 小 相同 。 

。 两 对 (two pair) : 两 个 对 子 。 

。 二 条 (three of a kind) : 三 张 牌 大 小 相同 。 
( 


。 顺 子 (straight) : 五 张大 小 相连 的 牌 (Ace 既 可 以 是 最 大 也 可 以 是 
最 小 ， 所 以 Ace-2-3-4-5 是 顺 子 ，10-Jack-Queen-King-Ace 也 是 ， 但 
Queen-King-Ace-2-3 不 是 ) 。 

同 花 flush) : 五 张 牌 花色 相同 。 

满 蔡 红 (ful house) : 三 张 牌 大 小 相同 ， 另 外 两 张 牌 大 小 相同 。 

四 条 (four of a kind) : 四 张 牌 大 小 相同 。 


。 同花顺 (straight flush) : 顺 子 (如 上 面 的 定义 ) 里 的 五 张 牌 都 是 
化 色相 同 的 。 


本 练习 的 目标 是 预测 这 些 手 牌 的 出 牌 概率 。 
1， 从 http://thinkpython2.com/code 下 载 这 些 文件 。 


。Card.py : 本 章 中 介绍 的 Card 、Deck 和 Hand 类 的 完整 代码 。 
。PokerHand.py : 表达 扑克 手 牌 的 一 个 类 ， 实 现 并 不 完整 ， 包 合 
一 些 测试 它 的 代码 。 


一 /人 一 


2.， 如 果 你 运行 PokerHand ,py ， 它 会 连 出 7 组 包含 7 张 卡 片 的 扑 
克 手 牌 ， 并 检查 其 中 有 没有 顺 子 。 在 继续 之 前 请 仔细 阅读 代码 。 


3. 在 PokerHand.py 中 添加 方法 has_pair 、has_twopair 
等 。 它 们 根据 手 脾 是 否 达到 相对 应 的 条 件 来 返回 True 或 False。 你 的 代 
码 应 当 对 任意 数量 的 手 牌 都 适用 〈 虽 然 最 常见 的 手 牌 数 是 5 或 7) 。 


4. 编写 一 个 函数 classify (分 类 ) ， 它 可 以 型 清楚 一 副手 牌 中 
出 现 的 最 大 的 组 合 ， 并 设置 1abel 属性 。 例 如 ， 一 副 7 张 牌 的 手 牌 可 能 
包含 一 个 顺 子 以 及 一 个 对 子 ; 它 应 当 标 记 为 “flush” ( 顺 子 ) 。 


5. 当 你 确保 分 类 方法 可 用 时 ， 下 一 步 是 预测 各 种 手 牌 的 概率 。 在 
PokerHand .py 中 编写 一 个 函数 ， 对 一 副 牌 进行 洗 牌 ， 将 其 分 成 不 同 
手 牌 ， 对 手 牌 进行 分 类 ， 并 记录 每 种 分 类 出 现 的 次 数 。 


6. 打印 一 个 表格 ， 展 示 各 种 分 类 以 及 它们 的 概率 。 更 多 次 地 运行 
你 的 程序 ， 直 到 输出 收敛 到 一 个 合理 程度 的 正确 性 为 止 。 将 你 的 结果 


和 http://en.wikipedia.org/wiki/ Hand_rankings 上 的 值 进行 对 比 。 


解答 : http://thinkpython2.com/code/PokerHandSoln.py° 


第 19 章 ”Python 拾 珍 


本 书 的 一 大 目标 一 直 是 尽 可 能 少 地 介绍 Python 语言 。 如 果 做 某 种 
事情 有 两 种 方法 ， 我 会 选择 一 种 ， 并 避免 提 及 另 一 种 。 或 者 有 时 候 ， 
我 会 把 兄 一 种 方法 作为 练习 进行 介绍 。 


本 章 我 会 市 领 大 家 回顾 那些 遗漏 的 地 方 。Python 提 供 了 不 少 并 不 
征 完 全 必需 的 功能 (不 用 它们 也 能 写 出 好 代码 ) ， 但 有 时 候 ， 使 用 这 
些 功 能 可 以 写 出 更 简 浩 、 更 可 读 或 者 更 高 效 的 代码 ， 甚 至 有 时 候 三 着 
兼 得 。 


19.1 条 件 表 达 式 
我 们 在 5.4 节 中 见 过 条 件 语 句 。 条 件 语句 通常 用 来 从 两 个 值 中 选择 


5 例如， 


if x > 0: 
y = math.1og(x) 
els 


6: 
y = float('nan’') 


这 条 语句 检查 x 是 否 为 正 数 。 如 果 为 正 数 ， 则 计算 math .1og ; 
如 果 为 负数 ，math.1og 会 抛 出 ValueError 异常 。 为 了 避免 程序 停 
止 ， 我 们 直接 生成 一 个 “NaN”， 一 个 特殊 的 浮 点 数 ， 代 表 “ 不 是 
数 ” (Not A Number) 。 


我 们 可 以 用 条 件 表达 式 来 更 简洁 地 写 出 这 条 语句 : 


y = math.log(x) if x > 0 else float('nan') 


这 条 语句 几乎 可 以 用 英语 直接 读 出 来 : “y gets log-x if x is greater 
than 0; otherwise it gets NaN”(Y 的 值 在 x 大 于 0 时 是 math .log(x) 
否则 是 NaN ) 。 


递归 函数 有 时 候 可 以 用 条 件 表达 式 重 写 。 例 如 ， 下 面 是 
factorial 的 一 个 递归 版 本 : 
def factorial(n): 


Ifn== 0: 
return 1 


else: 
return n * factorial(n-1) 


我 们 可 以 将 其 重 写 为 ; 


def factorial(n): 
return 1 if n == 0 else n * factorial(n-1) 


条 件 表达 式 的 男 一 个 用 途 是 处 理 可 选 参数 。 例 如 ， 下 面 是 
GoodKangaroo 的 init 方 法 (参见 练习 17-2) : 


def _ init (self, name, contents=None): 
self.name = name 
If contents == None: 
contents = [] 


self.pouch_ contents = contents 


我 们 可 以 将 其 重 写 为 : 


def _ init (self, name, contents=None): 


self.name = name 
self.pouch_contents = [] if contents == None else contents 


一 般 来 说 ， 如 采 条 件 语句 的 两 个 条 件 分 文 都 只 包含 简单 的 返回 或 
对 同一 变量 进行 赋值 的 表达 式 ， 那 么 这 个 语句 可 以 转化 为 条 件 表达 
i 


19.2 ”列表 理解 
在 10.7 节 中 我 们 已 经 见 过 映射 和 过 滤 模 式 。 例 如 ， 下 面 的 画 数 接 


收 一 个 字符 串 列 表 ， 将 每 个 元 素 通过 字符 串 方 法 capitalize 进行 映 
射 ， 并 返回 一 个 新 的 字符 串 列表 。: 


def capitalize all(t): 
res = [] 
for s in t: 


res.append(s.capitalize( )) 
return res 


我 们 可 以 用 列表 理解 (list comprehension) 把 这 个 函数 写 得 更 紧 
凌 : 


def capitalize_all(t) : 
return [s.capitalize() for s in t] 


上 面 的 方 括号 操作 符 说 明 我 们 要 构建 一 个 新 列表 。 方 括号 之 内 的 
表达 式 指定 了 列表 的 元 素 ， 而 for 子 句 则 表示 我 们 要 遍历 的 序列 。 


列表 理解 的 语法 有 一 点 粗糙 的 地 方 ， 因 为 里 面 的 循环 变量 ， 即 本 
例 中 的 s ， 在 表达 式 中 出 现在 定义 之 前 。 


列表 理解 也 可 以 用 于 过 滤 操 作 。 例 如 ， 下 面 的 函数 选择 列表 t 中 
的 大 写 元 素 ， 并 返回 一 个 新 列表 : 


def only_upper(t): 
res = [] 
for s in t: 
if s.isupper() 


res.append(s) 
return res 


我 们 可 以 用 列表 理解 将 其 重 写 为 : 


def only_upper(t): 
return [s for s in t if s.isupper()] 


对 于 人 简单 表达 式 来 说 ， 列 表 理 解 更 紧 竣 、 更 易于 阅读 ， 并 且 它 们 
通 肖 都 比 实 现 相同 功能 的 循环 更 快 ， 有 了 时候 甚 至 快 很 多 。 因 此 ， 如 果 
你 因为 我 没有 早 些 提 到 它 而 恼怒 ， 我 表示 十 分 理解 。 


但 是 我 得 办 解 一 下 ， 列 表 理 解 更 难以 调试 ， 因 为 你 没 法 在 循环 内 
添加 打印 语句 。 我 建议 你 只 在 计算 简单 到 一 次 吏 能 和 弄 对 的 时 候 才 使 用 
它 。 对 于 初学 者 来 说 ， 这 意味 着 从 来 不 用 。 


19.3 ”生成 器 表达 式 


生成 器 表达 式 (generator expression) 和 列表 理解 类 似 ， 但 是 它 
使 用 圆 括号 ， 而 不 是 方 括号 : 


>>> g = (x**2 for x in range(5)) 


>>> g 
<generator object <genexpr> at Ox7f4c45a786c0O> 


结果 是 一 个 生成 器 对 象 ， 它 知道 该 如 何 遍 历 值 的 序列 。 但 它 又 和 
列表 理解 不 同 ， 它 不 会 一 次 把 结果 都 计算 出 来 ， 而 征 等 待 请求 。 内 置 
函数 next 会 从 生成 历 中 获取 下 一 个 值 : 


>>> next(g) 
0 


>>> next (9g) 
1 


当 到 达 序 列 的 结尾 后 ，next 会 抛 出 一 个 StopIteration 寞 
常 。 可 以 使 用 for 循环 来 源 历 所 有 值 : 


>>> for val in d: 
print(val) 


生成 器 对 象 会 跟踪 记录 访问 序列 的 位 置 ， 所 以 for 循环 会 从 上 一 
个 next 所 在 的 位 置 继 续 。 一 旦 生成 颖 届 历 结束 ， 青 访问 它 就 会 抛 出 
StopException : 


>>> next(g) 
StopIteration 


生成 器 表达 式 经 常 和 sum 、max 和 min 之 类 的 函数 配合 使 用 : 


>>> sum(x**2 for x in range(5)) 
30 


19.4 any 和 all 


Python 提 供 了 一 个 内 置 画 数 any ， 它 接收 一 个 由 布尔 值 组 成 的 序 
列 ， 并 在 其 中 任何 值 是 True 时 返回 True 。 它 可 以 用 于 列表 : 


>>> any([False, False, True]) 


True 

但 它 更 常用 于 生成 句 表 达 式 : 
>>> any(letter == 't' for letter in "monty ') 
True 


上 面 这 个 例子 用 处 不 大 ， 因 为 它 做 的 事情 和 in 表达 式 一 样 。 但 是 
我 们 可 以 用 any 来 重 写 9.3 节 中 的 搜索 函数 。 例 如 ， 我 们 可 以 将 
avoids 函数 重 写 为 : 


def avoids(word, forbidden): 
return not any(letter in forbidden for letter in word) 


这 个 函数 读 起 来 几乎 和 英语 一 致 : “word avoids forbidden if there 
are not any forbidden letters in word” (我 们 说 一 个 word 避免 被 禁止 ， 
是 指 word 中 没有 任何 被 禁 的 字母 ) 。 


Python 还 提供 了 另 一 个 内 置 函 数 al1 ， 它 在 序列 中 所 有 元 素 都 是 
True 时 返回 True 。 作 为 练习 ， 请 使 用 all 重 写 9.3 广 中 的 uses_all 
函数 。 


19.5 集合 


我 曾 在 13.6 节 中 使 用 字典 来 寻找 在 文档 中 出 现 但 不 属于 一 个 单词 
列表 的 单词 。 我 写 的 函数 氨 收 一 个 字典 参数 dl ， 其 中 包含 文档 中 所 有 
的 单词 作为 键 ， 以 及 另 一 个 参数 d2 ， 包 含 单词 列表 。 它 返回 一 个 字 
典 ， 包 含 d1 中 所 有 不 在 d2 之 中 的 键 : 


def substract(d1i, d2): 


res = dict() 
for key in dl1: 
If key not in d2: 
res[key] = None 
return res 


在 这 些 字 典 中 ， 值 都 是 None ， 因 为 我 们 从 来 不 用 它们 。 因 此 ， 
我 们 实际 上 痕 费 了 一 些 存储 空间 。 


Python 还 提供 了 男 一 个 内 置 类 型 ， 称 为 集合 (set ) ， 它 表现 得 
和 没有 值 而 只 使 用 键 集合 的 字典 类 似 。 癌 一 个 集合 添加 元 素 很 快 ， 检 
查 集 合成 员 也 很 快 。 集 合 还 提供 方法 和 操作 符 来 进行 常见 的 集合 操 
作 。 


例如 ， 和 集合 减法 可 以 使 用 方法 difference 或 者 操作 符 “- ' 来 实 
现 。 因 此 我 们 可 以 将 substract 函数 重 写 为 : 


def substract(d1i, d2): 
return set(d1i) - set(d2) 


结果 是 一 个 集合 而 不 是 字典 ,但 是 对 于 遍历 之 类 的 操作 ， 表 现 是 
一 样 的 。 


本 书 中 的 一 些 练习 可 以 用 集合 来 更 加 简洁 且 高 效 地 实现 。 例 如 ， 
练习 10-7 中 的 has_duplicates 函数 ， 下 面 是 使 用 字典 来 实现 的 一 个 
解答 


def has_duplicates(t): 
d= 全 


return True 
d[x] = True 
return False 


一 个 元 素 第 一 次 出 现 的 时 候 ， 把 它 加 入 到 字典 中 。 如 果 相 同 的 元 
素 再 次 出 现时 ， 男 数 就 返回 True 。 


使 用 集合 ， 我 们 可 以 这 样 写 同一 个 函数 : 


def has_duplicates(t): 
return len(set(t)) < len(t) 


一 个 元 素 在 一 个 集合 中 只 能 出 现 一 次 ， 所 以 如 采 t 中 间 的 某 个 元 
素 出 现 超过 一 次 ， 那 么 变 成 集合 后 其 长 度 会 比 t 小 。 如 采 没 有 任何 重 
复元 素 ， 那 么 集合 的 长 度 应 当 和 t 相同。 


我 们 也 可 以 使 用 集合 来 解决 第 9 章 中 的 一 些 练习 。 例 如 ， 下 面 是 
uses_only 函数 使 用 循环 来 实现 的 版 本 : 


def uses_only(word, available): 
for letter in word: 
if letter not in available: 


return False 
return True 


uses_only 检查 word 中 所 有 的 字符 是 不 是 在 available 中 出 
现 。 我 们 可 以 这 样 重 写 : 


def uses_only(word, available): 
return set(word) <= set(available) 


操作 符 <= 检查 一 个 集合 是 否 古 男 一 个 集合 的 于 集 ， 包 括 两 个 集合 


相等 的 情况 。 这 正好 符合 word 中 所 有 子 符 都 出 现在 available 中 。 


19.6 ”计数 器 


计数 器 (counter) 和 集合 类 似 ， 不 同 之 处 在 于 ， 如 果 一 个 元 素 出 
现 超 过 一 次 ， 计 数 器 会 记录 它 出 现 了 多 少 次 。 如 采 你 熟悉 多 重 集 
(multiset) 这 个 数学 概念 ， 就 会 发 现 计数 器 是 多 重 集 的 一 个 自然 的 表 
达 方 式 。 


计数 器 定义 在 标准 模块 collections 中 ， 所 以 需要 导入 它 再 使 
用 。 可 以 用 字符 串 、 列 表 或 者 其 他 任何 支持 迁 代 访问 的 类 型 对 象 来 初 
8 化 计数 器 : 


>>> from collections import Counter 
>>> Count = Counter( 'parrot ' ) 


>>> count 
Counter({'r':2, 't': 


计数 右 有 很 多 地 方 和 字典 相似 。 它 们 将 每 个 键 映 冉 到 其 出 现 次 
数 。 和 字典 一 样 ， 键 必须 是 可 散 列 的 。 


但 和 字典 不 同 的 是 ， 在 访问 计数 器 中 不 存在 的 元 素 时 ， 它 并 不 会 
抛 出 异 角 。 相 反 ， 它 会 返回 0 : 


>>> Count[ 'd '] 
0 


我 们 可 以 使 用 计数 需 来 重 写 练习 10-6 中 的 is_anagram 函数 : 


def is_anagram(word1，word2) : 
return Counter(word1) == Counter (word2) 


如 有 果 两 个 单词 互 为 回 文 ， 则 它们 会 包含 相同 的 字母 ， 且 各 个 字母 
的 计数 相同 ， 所 以 它们 对 应 的 计数 器 对 象 也 会 相等 。 


计数 需 提 供 方法 和 操作 符 来 进行 类 似 集 合 的 操作 ， 包 括 集合 加 
法 、 减 法 、 并 集 和 交集 。 计 算 器 还 提供 一 个 非常 常用 的 方法 
most_common ， 它 返回 一 个 值 -频率 对 的 列表 ， 按 照 最 常见 到 最 少见 
来 排序 : 


>>> count = Counter('parrot') 
>>> for val, freq in count, most_common(3): 
print(val, freq) 


r2 
p 1 


19.7 defaultdict 


collections 模块 还 提供 了 defaultdict ， 它 和 字典 相似 ， 
不 同 的 是 ， 如 果 你 访问 一 个 不 存在 的 键 ， 它 会 自动 创建 一 个 新 值 。 


创建 一 个 defaultdict 对 象 时 ， 需 要 提供 一 个 用 于 创建 新 值 的 
函数 。 用 来 创建 对 象 的 函数 有 时 被 称 为 工厂 (factory) 函数 。 用 于 创 
建 列 表 、 集 合 以 及 其 他 类 型 对 象 的 内 置 函 数 ， 都 可 以 用 作 工 厂 函数 : 


>>> from collections import defaultdict 
>>> d = defaultdict(1ist) 


请 注意 ， 参 数 是 list (一 个 类 对 象 ) ， 而 不 是 list () (一 个 新 
的 列表 ) 。 你 提供 的 函数 直到 访问 不 存在 的 键 时 ， 才 会 被 调用 的 : 


>>> t = d['new key'] 
>>> 七 


[] 
新 列表 t 也 会 加 到 字典 中 。 所 以 ， 如 采 我 们 修改 t ， 改 动 也 会 在 d 
中 体现 : 


>>> t.append('new value') 
>>> d 


defaultdict(<class 'list'>, {'new key': ['new value']}) 


如 果 创 建 一 个 由 列表 组 成 的 字典 ， 使 用 defaultdict 往往 能 够 
帮 你 写 出 更 简洁 的 代码 。 在 练习 12-2 的 解答 中 ， 我 创建 了 一 个 字典 ， 
将 排序 的 字母 字符 串 映 射 到 可 以 由 那些 字母 拼写 出 来 的 单词 列表 。 例 
如 ，'"opst ' 映射 到 列表 [ 'opts'，'post',，'pots', 'spot', 
'stop'，'tops']。 可 以 从 
http://thinkpython2.com/code/anagram_sets.py 下 载 该 解答 。 


下 面 古 原始 的 代码 : 


def all anagrams (filename ) : 


for line in open(filename): 
word = line.strip().1lower() 
t = signature(word) 
if t not in d: 


d[t] = [word] 
else: 
d[t].append(word) 
return d 


这 个 函数 可 以 用 setdefault 简化 ， 你 可 能 在 练习 11-2 中 也 用 


all_anagrams (filename ) : 


for line in open(filename ) : 
word = line.strip().1lower() 


t = signature(word) 
d.setdefault(t, []).append(word) 
return d 


但 这 个 解决 方案 有 一 个 缺点 ， 它 不 管 是 否 需 要 ， 每 次 都 会 狐 建 一 
个 列表 。 对 于 列表 来 说 ， 这 并 不 算 大 问题 ， 但 如 果 工 三 函数 非常 复 
杂 ， 束 有 可 能 成 为 问题 了 。 


我 们 可 以 使 用 defaultdict 来 避免 这 个 问题 ， 并 进一步 简化 代 
码 : 


def all anagrams (filename ) : 
d = defaultdict(1ist) 
for line in open(filename ) : 
word = line.strip().lower() 


t = signature(word) 
d[t]. append(word) 
return d 


在 练习 18-3 的 解答 中 ， 画 数 has_straightflush 中 使 用 了 
setdefault 。 可 以 从 http:// thinkpython2.com/code/PokerHandSoln.py 
下 载 它 。 但 这 个 解决 方案 的 缺点 是 ， 不 管 是 否 必需 ， 每 次 循环 从 代 都 
会 创建 一 个 新 的 Hand 对 象 。 作 为 练习 ， 请 使 用 defaultdict 重 写 该 
函数 。 


19.8 ”命名 元 组 


多 简单 的 对 象 其 实 都 可 以 看 作 是 儿 个 相关 值 的 集合 。 例 如 ， 第 
15 草 中 定义 的 Point 对 象 ， 包 含 两 个 数字 ， 即 X 和 y“。 定 义 一 个 这 样 
的 类 时 ， 通 常会 从 init 方法 和 str 方法 开始 : 


class Point: 


def _ init (self, x=0, y=0): 
self .x x 
self.y = y 


def _ str__(self,): 
return '(%g, %g)' % (self.x, self.y) 


这 里 用 了 很 多 代码 来 传达 很 少 的 信息 。Python 提 供 了 一 个 更 简洁 
的 方式 来 表达 同一 个 意思 : 


from collections import namedtuple 
Point = namedtuple('Point', ['x', 'y']) 


第 一 个 参数 是 你 想 要 创建 的 类 名 。 第 二 个 参数 是 Point 对 象 应 当 包 
含 的 属性 的 列表 ， 以 字符 串 表 示 。namedtuple 的 返回 值 是 一 个 类 对 
象 : 


>>> Point 
<class ' main .Point'> 


这 里 Point 类 会 自动 提供 ”init 和 str_ _ 这 样 的 方法 ， 所 
以 你 不 需要 写 它们 。 


要 创建 一 个 Point 对 象 ， 可 以 把 Point 类 当 作 函数 来 用 : 


>>> p = Point(1, 2) 
>>> p 


Point (x=1, y=2) 


init 方法 使 用 你 提供 的 名 字 把 实 参 值 赋 给 属性 。str 方法 会 打 
印 出 Point 对 象 及 其 属性 的 字符 串 表示 。 


可 以 使 用 名 称 来 访问 命名 元 组 的 元 素 : 


>>> p.x, p.y 
(1, 2 


也 可 以 直接 把 它 当 作 元 组 来 处 理 : 


p[0], pL[L1] 
2) 


命名 元 组 提供 了 快速 定义 简单 类 的 方法 ， 但 其 缺点 古人 简单 的 类 并 
不 会 总 保持 简单 。 可 能 之 后 你 需要 给 命名 元 组 添加 方法 。 如 采 那 样 ， 
可 以 定义 一 个 新 类 ， 继 承 当 前 的 命名 元 组 : 


class Pointier(Point ) : 
# 在 这 里 添加 更 多 的 方法 


或 者 也 可 以 直接 切换 成 传统 的 类 定义 。 


19.9 ”收集 关键 词 参数 
在 12.4 节 中 ， 我 们 见 过 如 何 编写 画 数 将 其 参数 收集 成 一 个 元 组 ; 


def printall(*args): 
print(args) 


可 以 使 用 任意 个 数 的 按 位 实 参 (也 束 是 说 ， 不 市 名 称 的 实 参 ) 来 
调用 这 个 函数 : 


>>> printall(1, 2.0, '3') 
(1, 2.0, '3') 


但 是 * 号 操作 符 并 不 会 收集 关键 词 实 参 : 


>>> printall(1, 2.0, third='3') 
TypeError: printall() got an unexpected keyword argument "third' 


要 收集 关键 词 实 参 ， 可 以 使 用 ** 操 作 符 : 


def printall(*args, **kwargs): 
print(args, kwargs) 


这 里 收集 关键 词 形 参 可 以 任意 命名 ， 但 kwargs 是 一 个 币 见 的 选 
择 。 收 集 的 结果 是 一 个 将 关键 词 映 射 到 值 的 字典 : 


>>> printall(1, 2.0, third='3') 


(1, 2.0){'third': '3'} 


如 果 有 一 个 天 键 词 到 值 的 字典 ， 殊 可 以 使 用 分 散 操 作 符 ** 来 调用 


>>> d = dict(x=1, y=2) 
>>> Point(**d) 
Point(x=1, y=2) 


没有 用 分 散 操 作 符 的 话 ， 函 数 会 把 d 当 作 一 个 单独 的 按 位 实 参 ， 
所 以 它 会 把 d 赋值 给 x ， 并 因为 没有 提供 y 的 赋值 而 报错 : 
>>> d = dict(x=1, y=2) 


>>> Point(d) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: _ new_ () missing 1 required positional argument: 'y' 


当 处 理 参数 很 多 的 函数 时 ， 创 建 和 传递 字典 来 指定 第 用 的 选项 十 
非 党 有 用 的 。 


19.10 “术语 表 


条 件 表 达 式 (conditional expression) : 一 个 根据 条 件 返 回 一 个 或 
两 个 值 的 表达 式 。 


列表 理解 (list comprehension) : 一 个 以 方 框 包含 一 个 for 循 
环 ， 生 成 新 列表 的 表达 式 。 


生成 器 表达 式 (generator expression) : 一 个 以 括号 包含 一 个 for 
循环 ， 返 回 一 个 生成 器 对 象 的 表达 式 。 


多 重 集 (multiset) : 一 个 用 来 表达 从 一 个 集合 的 元 素 到 它们 出 现 
次 数 的 映射 的 数学 概念 。 


工厂 函数 (factory) : 一 个 用 来 创建 对 象 ， 并 常常 当 作 参 数 使 用 
的 函数 。 


19.11 练习 


练习 19-1 


下 面 的 函数 可 以 雍 归 地 计算 二 项 式 系数 : 


def binomial coeff(n, k): 


"计算 (n，k) 的 二 项 式 系数 . 


n: 试验 次 数 
k: 成 功 次 数 


返回 : int 

TITT TI 

if k == 0: 
return 1 

if n == 0: 
return 0 


res = binomial coeff(n-1, k) + binomial coeff(n-1, k-1) 
return res 


使 用 内 崩 条 件 表达 式 来 重 写 该 范 数 。 


注意 : 这 个 函数 效率 不 高 ， 因 为 它 会 不 停 地 重复 计算 相同 的 值 。 
Tt 参见 11.6 节 ) 来 提高 它 的 效率 。 但 你 
可 能 会 发 现 ， 使 用 条 件 表达 式 之 后 ， 添 加 备 起 会 变 得 比较 困难 。 


第 20 章 ”调试 


调试 程序 时 ， 应 当 区 分 不 同类 型 的 错误 ， 以 便 更 快 地 查找 出 错误 


原因 。 


语法 错误 (semantic error) 在 将 源 代码 翻译 为 字 节 码 的 过 程 中 由 
解释 器 发 现 。 它 们 通常 表示 有 程序 结构 错误 。 例 如 ， 在 def 语句 
的 末尾 漏 挥 冒号 ， 会 产生 一 个 有 些 见 余 的 错误 信息 
SyntaxError: invalid syntax ° 

运行 时 错误 (runtime error) 由 解释 器 在 程序 运行 的 过 程 中 发 现 错 
误 后 产生 。 大 部 分 错误 消息 都 包含 了 错误 发 生 的 位 置 以 及 正在 执 
行 的 函数 的 信息 。 例 如 : 一 个 无 限 递归 最 终 会 导致 运行 时 错误 
maximum recursion depth exceeded (超过 最 大 递归 深 
度 ) 。 

语义 错误 (semantic error) 是 程序 运行 中 没有 产生 错误 信息 ， 但 
做 的 事情 却 不 正确 的 情况 。 例 如 : 一 个 表达 式 求 值 的 顺序 和 你 预 
想 的 不 同 ， 因 此 产生 了 不 正确 的 结果 。 


调试 的 第 一 步 束 是 弄 清 楚 你 面 对 的 到 底 古 哪 种 类 型 的 错误 。 虽 然 


下 面 的 几 节 是 按照 错误 类 型 来 组 织 的 ， 但 有 些 技巧 其 实 可 以 适用 于 多 
种 情形 。 


20.1 语法 错误 


语法 错误 ， 在 弄 清 厅 它 们 是 什么 之 后 ， 通 常 都 很 容易 修正 。 不 入 
的 是 ， 错 误 信息 往往 没什么 帮助 。 最 常见 的 错误 信息 是 
SyntaxError: invalid syntax 和 SyntaxError: invalid 


token ， 这 两 种 都 没 多 少 信 息 量 。 


男 一 方面 ， 信 息 也 确实 告诉 你 问题 在 程序 中 发 生 的 位 置 。 实 际 
上 ， 它 告诉 你 的 是 Python 发 现 错误 的 位 置 ， 而 并 不 一 定 总 和 错误 发 生 
的 位 置 相同 。 有 时 候 错 误 发 生 在 错误 信息 指明 的 位 置 之 前 ， 往 往 是 前 
一 行 。 


如 有 果 你 递增 地 构建 程序 ， 应 当 很 清楚 错误 发 生 的 位 置 。 它 第 前 在 
你 最 后 添加 的 那 行 代码 上 。 


如 果 你 是 从 书本 中 复制 代码 ， 则 最 好 先 仔细 比较 目 己 的 代码 和 书 
中 的 代码 。 检 查 每 一 个 字母 。 同 时 请 记得 书本 也 可 能 是 错 的 ， 所 以 如 
果 你 看 到 一 个 像 是 语法 错误 的 东西 ， 那 么 它 有 可 能 束 是 。 


下 面 是 一 些 可 以 避免 最 第 见 的 语法 错误 的 方法 。 
1. 确保 你 没有 使 用 Python 关键 字 作为 变量 名 称 。 


2. 检查 在 每 一 个 复合 语句 的 语句 头 结尾 ， 都 有 一 个 冒号 ， 包 括 
for 、while 、if 和 def 语句 。 


3. 确保 程序 中 每 个 字符 串 都 有 前 后 匹配 的 引号 。 确 定 每 个 括号 都 
是 目 引 [二 全 而 不 是 党 史 近代 旭 人 3 


4. 如 果 有 三 引号 ( 单 引号 或 双 引 号 字符 ) 多 行 字符 串 ， 确 保 你 正 
确 结束 了 字符 串 。 没 有 正确 结束 的 字符 串 ， 会 导致 程序 结尾 处 产生 
invalid token 错误 ,或 者 它 会 将 接 下 来 的 程序 看 作 字 符 串 的 一 部 
分 ， 直 到 遇 到 下 一 个 字符 串 为 止 。 这 种 情况 下 ， 可 能 都 不 会 产生 错误 


言 忌 ! 
5, 没有 关闭 的 开始 符号 (( 、{ 或 [) 会 让 Python 继续 解析 下 一 


行 ， 并 当 作 当前 语句 的 一 部 分 。 通 党 来 说 ， 会 在 下 一 行 立 即 产生 一 个 


划 误 。 


6. 检查 在 条 件 判断 时 将 =’ 写成 和 =’ 的 经 典 错误 。 


7. 检查 缩 进 ， 确 保 它 们 十 按照 设想 正确 排 布 的 。 Python 可 以 处 理 
空格 和 制 表 符 ， 但 如 采 混 合 使 用 它们 ， 则 可 能 产生 问题 。 避 人 免 这 种 问 
最 好 的 办 法 是 使 用 一 个 懂得 Python 的 编辑 器 ， 并 由 它 产生 一 致 的 缩 


EM 


8， 如 果 你 的 代码 中 有 非 ASCII 字 符 (包括 字符 串 和 注释 中 ) ， 虽 
然 Python 3 通常 能 处 理 好 韭 ASCII 字 符 ， 但 还 是 可 能 导致 问题 。 当 你 从 
网 页 或 其 他 来 源 直 接 复 制 文本 时 ， 需 要 格外 注意 。 


如 果 上 面 的 办 法 都 没 用 ， 请 继续 看 下 一 节 。 
我 一 直 进 行 修改 ,但 没有 什么 区 别 


如 琳 解 释 器 报 出 一 个 错误 而 你 又 找 不 到 ， 有 可 能 十 因为 解释 右 和 
你 用 的 并 不 古 同 一 套 代码 。 检 查 你 的 编程 环境 ， 确 保 你 正在 编辑 的 代 


一 一 


码 和 Python 运行 的 是 同一 个 。 


如 果 不 确定 ， 可 以 笑 试 在 程序 开头 加 上 一 个 明显 而 故意 的 错误 。 
再 运行 一 次 。 如 果 解 释 器 并 没有 发 现 新 的 错误 ， 那 么 说 明 你 运行 的 不 
征 新 代码 。 


可 能 有 以 下 几 种 原因 。 


。 你 编辑 了 代码 ， 但 起 了 保存 更 改 束 直接 运行 了 。 有 的 编程 环境 会 
帮 你 目 动 保存 ， 有 的 不 会 。 

。 你 修改 了 文件 名 ， 但 仍然 在 使 用 旧 文 件 名 运行 程序 。 

。 你 的 编程 环境 可 能 没有 正确 配置 。 

。 如 采 你 在 编写 一 个 模块 ， 并 使 用 import ， 请 确保 你 的 模块 名 称 
没有 和 Python 标 准 模块 冲突 。 

。 如 有 果 你 在 使 用 import 来 读 入 模块 ， 请 记得 重 载 一 个 修改 过 的 文 
件 时 ， 需 要 重启 解释 器 或 者 使 用 reload 。 如 果 你 直接 重新 导入 
这 个 模块 ， 它 并 不 会 做 任何 事 。 


如 果 你 直到 困难 被 卡 住 ， 而 且 弄 不 清楚 到 发 怎 么 回 事 ， 一 个 办 法 
是 重新 以 最 简单 的 类 似 “Hello，World! ”的 程序 开始 ， 并 确保 你 能 让 
一 个 已 知 的 程序 正确 运行 。 然 后 逐渐 添加 原先 程序 的 部 分 到 新 的 程序 
-= 


20.2 ”运行 时 错误 


一 旦 你 的 程序 已 经 确保 语法 正确 ，Python 可 以 读 它 ， 并 且 至 少 可 
以 开始 运行 它 。 这 时 候 可 能 发 生 哪些 错误 ? 


20.2.1 我 的 程序 什么 都 不 做 


这 个 问题 最 常见 的 原因 是 你 的 文件 包含 了 各 种 函数 和 类 的 定义 ， 
但 没有 实际 调用 函数 来 局 动 执 行 。 如 采 你 是 为 了 导入 模块 使 用 它们 提 
供 的 类 和 函数 ， 那 么 这 么 做 可 能 是 故意 的 。 


如 果 不 是 故意 的 ， 则 确保 在 程序 中 有 一 个 函数 调用 ， 并 确保 执行 
流程 能 到 达 这 一 函数 调用 《参见 20.2.5T) 。 


20.2.2 ”我 的 程序 卡 死 了 


如 有 果 一 个 程序 突然 停止 并 看 起 来 什么 事情 部 没 做 ， 它 束 “ 卡 死 
了 ”。 通常 这 意味 着 程 序 掉 入 一 个 死 循环 或 者 无 限 递 归 中 。 


。 如 果 怀 疑 一 个 特别 的 循环 可 能 是 问题 所 在 ， 可 以 在 循环 开始 前 汪 
加 一 个 print 语句 ， 打 出 “进入 循环 "， 在 循环 结尾 处 之 后 也 添加 
一 个 ， 打 出 “退出 循环 "。 


再 次 运行 程序 。 如 果 你 看 到 第 一 个 输出 ， 而 没有 看 到 第 二 个 ， 说 
明 你 确实 遇 到 一 个 死 循 环 了 。 无 限 循环 的 内 容 参 见 20.2.3 节 。 


。 大 部 分 情况 下 ， 无 限 递归 都 会 让 程序 运行 一 会 儿 ， 然 后 产 
生 “RuntimeError: Maximum recursion depth exceeded” 错 误 。 如 果 
发 生 这 种 情况 ， 参 见 20.2.4 季 。 


如 有 果 你 没有 看 到 这 个 错误 ,但 怀疑 可 能 是 递归 方法 或 钞 数 产 生 的 
问题 ， 也 同样 可 以 使 用 20.2.4 市 中 的 技巧 。 


。 如 采 上 面 两 步 都 没 用 ， 笑 试 其 他 循环 或 其 他 递归 方法 与 琅 数 。 


。 如 果 这 些 都 没 用 ， 说 明 可 能 是 你 没 理解 你 的 程序 的 执行 流程 。 执 
行 流程 的 内 容 参 见 20.2.5 记 。 


20.2.3 ”无限 循环 


如 果 你 觉得 有 一 个 无 限 循环 并 知道 是 哪个 循环 导致 的 问题 ， 可 以 
在 循环 的 结尾 处 添加 一 个 print 语句 ， 打 印 出 循环 条 件 中 的 变量 值 ， 
以 及 条 件 的 值 。 


例如 : 


while x>0 andy<0.: 
# do something to x 
# do something to y 


print('x: ', xXx) 
print('y: ', y) 
print("condition: ", (x > 0 andy < 0)) 


现在 当 你 再 次 运行 程序 时 ， 能 够 看 到 每 次 循环 中 打印 出 的 3 行 输 
出 。 最 后 一 次 循环 时 ， 条 件 应 该 变 为 False 。 如 果 循 环 一 直 进 行 ， 你 
应 当 可 以 看 到 x 和 y 的 值 ， 并 可 能 弄 清 楚 为 什么 它们 没有 修正 确 更 
新 。 


20.2.4 无限 递归 


大 部 分 情况 下 ， 无 限 递归 会 导致 程序 运行 一 会 儿 ， 然 后 产生 
Maximum recursion depth exceeded 的 错误 。 


如 采 你 怀疑 一 个 函数 导致 了 无 限 递归 ， 保 证 递归 确实 有 一 个 基准 
情形 。 应 该 有 一 个 条 件 能 导致 画 数 直接 返回 而 不 再 继续 递归 调用 。 如 


果 没 有 ， 那 么 你 可 能 需要 重新 思考 算法 ， 并 定位 一 个 基准 情形 。 


如 果 有 一 个 基准 情形 ， 但 程序 似乎 没有 到 达 它 ， 可 以 在 函数 的 开 
头 加 一 个 print 语句 来 打印 参数 。 现 在 当 你 重新 运行 程序 时 ， 会 看 到 
每 次 函数 调用 时 都 会 打出 几 行 输出 ， 并 能 看 到 每 次 调用 的 参数 值 。 如 
果 参 数 并 没有 回 基 准 情 形变 化 ， 你 大 概 能 发 现 为 何如 此 。 


20.2.5 “执行 流程 


如 有 条 你 不 确认 程序 中 的 执行 流程 如 何 走 同 ， 可 以 在 每 个 函数 的 开 
头 添加 一 个 print 语句 ， 打 印 类 似 “ 进 入 函数 foo ”之 类 的 输出 。 这 里 
foo 是 函 效 名 。 


现在 如 果 你 重新 运行 程序 ， 它 会 打印 出 每 个 函数 调用 的 轨迹 。 
20.2.6 ” 当 我 运行 程序 ， 会 得 到 一 个 异常 

如 果 在 运行 时 过 到 一 个 问题 ，Python 会 打印 出 一 个 信息 ， 包 含 错 
误 的 名 称 ， 程 序 中 发 生 这 个 错误 的 位 置 ， 以 及 一 个 回溯 。 


回潮 里 标明 了 当前 执行 的 画 数 ， 以 及 调用 它 的 函数 ， 以 及 调用 这 
个 调用 者 的 画 数 ， 依 此 类 推 。 换 句 话 说 ， 它 回 滴 了 从 程序 开头 直到 错 
误 发 生 所 在 位 置 的 整个 调用 轨迹 ， 包 括 了 每 个 范 数 所 在 文件 中 的 行 


第 一 步 是 检查 程序 中 错误 发 生 的 位 置 ， 并 壬 试 弄 清楚 问题 所 在 。 


全 
下 面 是 一 些 常见 的 运行 时 错误 。 


NamekError 


你 在 试图 使 用 一 个 当前 环境 中 并 不 存在 的 变量 。 检 查 变 量 名 是 否 
有 拼写 正确 ， 或 至 少 是 一 致 。 请 记得 局 部 变量 是 局 部 的 ， 不 能 在 定义 
它们 的 函数 之 外 使 用 。 


TypeError 
有 3 种 可 能 的 原因 。 


。 你 在 笑 试 错误 地 使 用 一 个 值 。 例 如 ， 使 用 不 古 整 数 的 值 来 索引 子 
符 串 、 列 表 或 元 组 。 

格式 字符 串 中 ， 内 部 的 格式 项 和 传 入 的 参数 不 匹配 。 当 格式 项 的 
数目 不 对 或 者 转换 的 类 型 不 对 时 都 可 能 发 生 。 

调用 函数 时 使 用 了 错误 数量 的 参数 。 对 于 方法 来 说 ， 查 看 方法 害 
义 并 检查 第 一 个 参数 是 否 为 self 。 接 着 查看 方法 调用 ; 确保 你 
征 在 正确 类 型 的 对 象 上 调用 方法 ， 并 正确 提供 了 其 他 参数 。 


KeyError 


你 在 试图 用 一 个 字典 并 不 包含 的 键 来 查找 字典 的 元 素 。 如 采 刍 是 
字符 串 ， 请 注意 大 小 写 问 题 。 


AttributeError 


你 在 笑 试 访问 一 个 并 不 存在 的 属性 或 方法 。 检 查 拼 写 ! 你 可 以 使 
用 内 置 的 vars 函数 来 列 出 存在 的 属性 。 


如 果 AttributeError 指 明 一 个 对 象 是 NoneType ， 则 意味 着 它 是 
None 。 那 么 问题 不 是 属性 名 而 是 对 象 。 


对 象 为 None 的 原因 可 能 是 你 饼 了 从 函数 里 返回 值 ， 如 果 画 数 执行 
到 结尾 都 没有 过 到 return 语句 ， 那 么 它 会 返回 None 。 男 一 个 常见 的 
原因 是 使 用 了 一 个 返回 None 的 列表 方法 作为 结果 ， 如 sort 。 


IndexError 


你 在 访问 列表 、 字 符 串 或 元 组 时 使 用 的 索引 大 于 它 的 长 度 减 一 。 
在 错误 发 生 的 前 一 行 ， 添 加 一 个 print 语句 展示 索引 的 值 和 数组 的 长 
度 。 数 组 长 度 是 否 正 确 ? 索引 大 小 是 否 正 确 ? 


Python 调试 器 (pdb ) 在 查找 异常 时 很 有 用 ， 因 为 它 让 你 可 以 在 
错误 发 生 之 前 的 地 方 查 看 程序 的 状态 。 可 以 在 
http:/docs.python.org/3/Vlibrary/pdb.html 赔 读 pdb 的 相关 资料 。 


20.2.7 ”我 添加 了 太 多 print 语句 ， 被 输出 淹没 了 


使 用 print 语句 进行 调试 的 问题 之 一 是 你 可 能 被 太 多 的 输出 所 埋 
没 。 有 两 种 方法 可 以 继续 ， 简 化 输出 ， 或 者 简化 程序 。 


要 们 化 输出 ， 可 以 删除 或 注释 掉 没 用 的 print 语句 ， 或 者 将 它们 
合并 起 来 ， 或 者 格式 化 输出 让 它们 更 容易 看 懂 。 
要 人 简化 程序 ， 有 儿 件 事情 可 做 。 首 先 ， 人 简化 程序 所 处 理 的 问题 。 


例如 ， 如 有 果 你 在 搜索 一 个 列表 ， 殊 改 为 搜索 一 个 很 小 的 列表 。 如 采 程 
序 从 用 户 获得 输入 ， 则 输入 可 以 产生 错误 的 最 简单 的 输入 。 


其 次 ,清理 程序 。 删 除 无 效 代码 ， 并 重新 组 织 代码 让 它 尽 可 能 更 
可 读 。 例 如 ， 如 果 你 怀疑 问题 出 在 程序 的 一 个 很 深 的 肉 套 部 分 中 ， 则 


应 当 壬 试 重 写 那 部 分 ， 让 它 的 结构 更 简单 。 如 果 你 怀疑 一 个 很 大 的 函 
数 ， 则 壬 试 将 它 拆 分 为 多 个 更 小 的 函数 ， 并 分 别 测试 它们 。 

找寻 最 稍 测 试用 例 的 过 程 往往 能 市 你 找到 问题 所 在 。 如 采 发 现 程 
序 在 一 种 情况 下 正 闻 工作 ， 而 在 另 一 种 情况 下 则 不 能 ， 那 这 些 情况 本 
喘 束 给 你 一 些 线索 。 

类 似 地 ， 重 写 一 部 分 代码 可 以 帮 你 找到 细微 的 bug。 如 果 你 做 出 一 
个 认为 不 该 影响 程序 的 改变 ， 而 它 确实 出 问题 了 ， 这 束 给 了 具体 的 提 


20.3 ”语义 错误 


从 某 种 角度 看 ， 语 义 错误 更 难 调试 ， 因 为 解释 器 并 不 提供 任何 信 
思 。 只 有 你 目 己 知道 程序 到 确 应 该 怎么 做 。 


解决 语义 错误 的 第 一 步 是 在 程序 文本 和 你 看 到 的 程序 行为 之 间 建 
立 一 个 连 授 。 你 需要 对 程序 实际 在 做 什么 有 一 个 假设 。 让 这 件 事情 很 
难 的 原因 之 一 是 计算 机 运行 得 太 快 。 


你 常常 会 希望 程序 能 够 减 慢 到 人 的 速度 ， 而 使 用 调试 絮 时 你 可 以 
做 到 。 但 往 程 序 里 插入 儿 条 精确 放置 的 print 语句 ， 比 起 设置 调试 
全， 插入 或 删除 断 点 ， 并 “ 单 步 ”执行 到 程序 出 错 的 地 方 ， 往 往 花 费 的 
时 间 更 少 。 
20.3.1 我 的 程序 运行 不 正确 


你 应 该 问 目 己 如 下 儿 个 问题 。 


。 程序 中 有 没有 地 方 你 期 望 它 去 做 而 实际 上 没有 发 生 的 ? 找到 运行 
那 段 功能 的 代码 ， 并 确保 它 确实 如 你 所 期 望 的 那样 运行 了 。 

。 有 没有 一 些 不 应 该 发 生 的 事情 ? 找到 程序 中 运行 了 某 种 不 该 出 现 
的 功能 的 代码 。 

。 有 没有 一 段 代 码 产 生 的 效果 和 你 所 期 望 的 不 一 致 ? 确保 你 完全 明 
日 该 段 代码 ， 特 别 是 当 它 牵涉 到 其 他 Python 模 块 的 函数 或 方法 
时 。 阅 读 你 调用 的 函数 的 文档 。 使 用 简单 的 测试 用 例 测 试 它 们 并 
检查 结果 。 


为 了 能 够 编程 ， 你 需要 程序 如 何 工作 的 一 个 思维 模型 。 如 采编 写 
出 一 段 和 你 预期 不 同 的 代码 ， 管 常 问题 不 是 在 程序 本 映 ， 而 是 在 你 的 
思维 模型 上 。 


修正 你 的 思维 模型 的 最 佳 方法 是 将 程序 划分 成 不 同 部 分 (通常 是 
函数 和 方法 ) 并 独立 测试 每 一 个 部 分 。 一 旦 找到 你 的 模型 和 真实 世界 
的 偏 闪 ， 束 能 够 解决 问题 了 。 

当然 ， 在 开发 程序 时 你 应 当 分 组 件 进 行 构建 和 测试 。 如 果 发 现 一 
个 问题 ， 应 该 只 需要 检查 一 小 部 新 的 不 确认 是 否 正 确 的 代码 。 


20.3.2 ”我 有 一 个 巨大 而 复杂 的 表达 式 ， 而 它 和 我 预料 的 不 同 


编写 复杂 的 表达 式 并 没有 问题 ， 只 要 能 保证 它们 还 可 读 。 但 它们 
也 会 变 得 更 难 调试 。 将 复杂 的 表达 式 拆 分 成 一 系列 的 赋值 到 临时 变量 
的 语句 ， 和 常常 是 个 好 主意 。 


例如 : 


self.hands[i].addCcard(self.hands[self.findNeighbor(i)].popCcard()) 


这 个 表达 式 可 以 写作 : 


neighbor = self.findNeighbor(i) 
pickedCard = self.hands[neighbor].popCard() 


self.hands[i].addCcard(pickedCard) 


后 面 更 清晰 的 版 本 也 更 加 可 读 ， 因 为 变量 名 称 提供 了 附加 的 文档 
信息 ， 它 也 更 加 容易 调试 ， 因 为 你 可 以 检查 中 间 变 量 的 类 型 ， 并 打印 
它们 的 值 。 

复杂 表达 式 的 另 一 个 问题 是 求 值 的 顺序 可 能 和 你 所 期 望 的 不 同 。 
例如 ， 如 采 你 将 表达 式 x /2r 翻 译 成 Python， 可 能 会 这 么 写 : 


y=x/ 2 * math,.pi 


这 样 并 不 正确 ， 因 为 乘法 和 除法 有 相同 的 优先 级 ， 并 且 语 句 求 值 
的 顺序 是 从 左 至 右 。 所 以 这 个 表达 式 计算 的 实际 上 是 xrV2。 


调试 表达 式 的 一 个 好 办 法 是 添加 括号 来 显 式 控 制 求 值 顺 序 : 


y=x/ (2 * math.pi) 


任何 时 候 如 果 不 确定 求 值 的 顺序 ， 都 可 以 使 用 括号 。 这 样 不 但 会 
让 程序 更 加 正确 (从 按照 你 的 设想 来 做 的 角度 说 ) ， 也 会 让 其 他 人 更 
容易 阅读 你 的 代码 ， 因 为 不 需要 去 记忆 操作 的 顺序 。 


20.3.3 ”我 有 一 个 函数 ， 返 回 值 和 预期 不 同 


如 果 你 在 程序 中 有 return 语句 返回 一 个 复杂 的 表达 式 ， 则 没有 
机 会 在 返回 之 前 打印 结果 。 这 时 候 ， 也 可 以 使 用 临时 变量 。 例 如 ， 这 


个 语句 : 


return self.hands[i].removeMatches() 


可 以 写作 : 


count = self.hands[i].removeMatches() 
return count 


现在 你 有 机 会 在 返回 之 前 显示 count 的 值 了 。 


20.3.4 ”我 真 的 真 的 卡 住 了 ， 我 需要 帮助 


首先 ， 试 着 离开 计算 机 几 分钟 。 计 算 机 会 发 射 辐 射影 响 大 脑 ， 产 
生 下 列 症状 。 


。 挫败 感 和 慑 怒 感 。 

。 迷信 的 信念 (“我 的 计算 机 恨 我 % 和 神奇 的 想法 (“程序 只 有 在 我 
有 反 戴 帽子 时 才 正 确 运 行 ”) 。 

。 随机 行走 编程 ( 壬 试 着 写 下 所 有 可 能 的 程序 ， 并 选择 运行 正确 的 
I 


如 有 果 你 发 现 目 己 正在 遭受 这 些 症状 之 一 ， 请 号 上 站 起 来 出 去 散 个 
。 当 你 平静 下 来 后 ， 再 思考 程序 。 它 在 做 什么 ? 产生 那 种 行为 的 可 
原因 有 哪些 ? 上 一 次 程序 还 正确 运行 是 什么 时 候 ， 之 后 你 做 了 什 
? 


有 时候 发 现 一 个 bug 确 实 需 要 时 间 。 我 第 第 能 够 在 远离 计算 机 并 让 
思维 休 恩 之 后 找到 bug。 找 到 错误 的 最 佳 地 点 有 火车 上 、 浴 拭 中 及 将 要 
入 睡 之 前 在 床上 。 


20.3.5 不行 ， 我 真 的 需要 帮助 


这 种 事 确实 会 发 生 。 即 使 最 好 的 程序 员 也 会 偶尔 卡 住 。 有 时 候 你 
在 一 段 程序 上 工作 太 久 了 所 以 反而 看 不 到 错误 。 你 需要 一 双 痢 的 眼 


睛 。 


在 叫 人 帮忙 之 前 ， 请 确保 你 已 经 准备 好 。 你 的 程序 应 当 尽 量 简 
单 ， 而 你 应 当 使 用 最 小 的 输入 来 复 现 错误 。 你 应 当 在 合适 的 地 方 放 好 
了 print 语句 〈 并 且 它们 的 输出 应 当 容 易 理 解 ) 。 你 应 当 足 够 理解 这 
个 问题 ， 因 此 能 够 简明 扼要 地 描述 它 。 


当 你 找 人 帮忙 时 ， 请 确保 给 他 们 需要 的 信息 。 


。 如 果 有 错误 信息 ， 它 是 什么 ， 它 代表 了 程序 的 哪 部 分 ? 

。 在 这 个 错误 发 生 之 前 ， 你 做 的 最 后 一 件 事情 是 什么 ? 你 写 的 最 后 
一 段 代 码 是 什么 ? 失败 的 新 测试 用 例 是 什么 ? 

。 目 前 为 止 你 做 了 哪些 答 试 ， 并 从 中 得 到 了 什么 ? 


当 你 找寻 bug 时 ， 思 考 一 下 如 何 做 才能 找 得 更 快 。 下 一 次 见 到 类 似 
的 情形 时 ， 束 能 够 更 快 地 找到 问题 了 。 


记 住 ， 目 标 不 只 是 让 程序 正确 运行 。 目 标 是 学 会 如 何 让 程序 正确 


运行 。 
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这 个 附录 编选 目 O’Reilly Media 出 版 的 Allen B. Downey 的 Think 
Complexity (2012) 一 书 。 当 你 读 完 本 书 之 后 ， 可 能 会 想 继续 读 那 本 
书 。 


算法 分 析 是 计算 机 科学 的 一 个 分 支 ， 研 究 算法 的 性 能 ， 尤 其 是 它 
们 的 运行 时 间 和 空间 需求 。 参 见 
http://en.wikipedia.org/wiki/Analysis_of_algorithms ° 


算法 分 析 的 实践 目标 是 预测 不 同 算法 的 性 能 ， 以 便于 指导 设计 决 
策 。 


在 2008 年 的 美国 总 统 大 选中 ， 候 选 人 巴 拉 克 :奥巴马 在 访问 Google 
公司 时 被 要 求 做 一 个 即兴 分 析 。Google 的 首席 执行 官 埃 里 克 : 施 密 特 问 
他 “给 100 万 个 32 位 整数 排序 的 最 高 效 算 法 ?是 什么 *。 奥巴马 显然 被 提示 
了 ， 因 为 他 马上 回答 , “我 觉得 冒 泡 排序 可 能 是 错误 的 做 法 ”。 人 参见 
http://bit.ly/1MpIwTIf 。 


这 是 真 的 ， 冒 泡 排 序 在 概念 上 很 简单 ， 但 对 于 大 数据 量 的 排序 很 
受 。 施 密 特 想得到 的 答案 可 能 是 “基数 排 


部 ” (http://en.wikipedia.org/wiki/Radix_sort) [i 。 


J 


一 > 


算法 分 析 的 目标 是 在 不 同 算法 间 做 出 有 意义 的 比较 ， 但 也 有 一 些 


问题 。 


。 算法 的 相对 性 能 可 能 依赖 于 硬件 的 特征 ， 所 以 一 个 算法 可 能 在 机 
吉 A 上 更 快 ， 另 一 个 在 机 郝 B 上 更 快 。 这 个 问题 的 通用 解决 方法 旦 
先 指定 一 个 机 器 模 型 ， 并 分 析 在 一 个 指定 的 机 器 模型 中 一 个 算法 
需要 执行 的 步骤 或 操作 。 

相对 性 能 还 可 能 依赖 于 数据 集 的 细节 特征 。 例 如 ， 有 的 排序 算法 
在 数据 已 经 是 部 分 排序 的 情形 下 比 其 他 算法 更 快 ， 有 的 程序 在 这 
种 情况 下 反而 慢 。 避 免 这 个 问题 的 通常 办 法 是 分 析 最 坏 情况 场 

景 。 有 时 候 分 析 平 均 情 况 的 性 能 也 有 用 ， 但 也 通 利 会 更 难 ， 因 为 
有 哪些 情形 可 以 用 来 “平均 ”往往 并 不 明显 。 

相对 性 能 也 依赖 于 问题 的 规模 。 对 小 序列 更 快 的 排序 算法 可 能 对 
大 序列 束 慢 了 。 这 个 问题 的 通常 解决 方案 是 用 一 个 问题 规模 的 函 
数 来 表达 运行 时 间 (或 操作 数 ) ， 并 根据 问题 规模 增 大 的 速度 将 
函数 进行 归 类 。 


这 种 比较 的 好 处 之 一 是 自然 而 然 地 可 以 将 算法 进行 简单 地 分 类 。 
例如 ， 如 果 我 知道 算法 A 的 运行 时 间 趋 向 于 和 输入 的 规模 mn 成 比例 ， 而 
算法 B 趋 向 于 和 n“ 成 比例 ， 那 么 我 会 预期 至 少 对 于 大 的 n 值 ， 算 法 A 比 
算法 B 快 。 


这 种 分 析 也 有 需要 注意 的 地 方 ， 后 面 会 谈 到 。 
21.1 增长 量 级 
假设 你 需要 分 析 两 个 算法 ， 并 依照 输入 的 规模 来 表达 它们 的 运行 


时 间 : 算法 A 需要 100n +1 步 来 解决 规模 为 n 的 问题 ， 算 法 B 需 要 n*+n 
+1 步 。 


下 面 的 表格 显示 了 这 两 个 算法 在 不 同 的 问题 规模 下 的 运行 时 间 : 


输入 规模 算法 A 的 运行 时 间 算法 B 的 运行 时 间 


100 


1 000 100 001 1 001 001 


在 n =10 时 ， 算 法 A 看 起 来 很 差 ， 它 几乎 需要 10 倍 于 算法 B 的 时 间 。 
但 对 于 n =100 来 说 它们 就 已 经 差不多 了 ， 而 在 更 大 的 规模 时 ， 算 法 A 远 
好 于 算法 B 。 


这 里 根本 的 原因 在 于 对 很 大 的 n 值 ， 任 何 包 售 n“ 项 的 函数 都 会 比 
首 项 是 n 的 函数 增长 快速 很 多 。 首 项 是 一 个 多 项 式 中 最 高 次 方 的 项 。 


对 于 算法 A， 前 项 有 一 个 很 大 的 系数 100， 因 此 算法 B 在 小 的 n 时 比 
算法 A 快 。 但 不 论 系数 是 多 少 ， 总 有 一 个 n 值 会 导致 an“> bn 。 


对 于 非 首 项 来 说 也 如 此 。 即 使 算法 A 的 运行 时 间 是 n +1000000， 对 
于 足够 大 的 n ， 仍 然 会 比 算法 B 快 。 


总 的 来 说 ， 我 们 预期 有 更 小 的 首 项 的 算法 对 大 规模 问题 来 说 是 更 
好 的 算法 。 但 对 于 小 一 些 的 问题 来 说 ， 可 能 存在 一 个 交叉 点 ， 那 里 其 


他 算法 可 能 更 好 。 交 叉 点 的 位 置 取决 于 算法 的 细 了 、 输 入 以 及 硬件 的 
条 件 ， 所 以 在 算法 分 析 时 常常 被 名 上 略 控 。 但 那 并 不 意味 着 你 可 以 起 记 
它 。 

如 采 两 个 算法 有 相同 的 衣 项 ， 则 很 难说 哪 一 个 更 好 ; 同样 地 ， 答 
案 也 取决 于 细 市 条 件 。 所 以 对 于 算法 分 析 来 说 ， 站 项 相同 的 范 数 被 认 
为 是 同等 的 ， 即 使 它们 的 系数 不 同 。 


增长 量 级 就 是 各 种 增长 行为 被 认为 是 同等 的 函数 的 集合 。 例 如 ， 
2n 、100n 和 mn +1l 都 是 一 个 增长 量 级 ， 用 大 0 标记 法 写作 O (n )， 通 常 称 
为 线性 的 ， 因 为 这 个 集合 中 的 每 个 函数 都 依据 n 线性 增长 。 


所 有 首 项 是 n? 的 函数 都 属于 O (n?)， 它 们 被 称 为 是 平方 的 。 


下 面 的 表格 显示 了 算法 分 析 中 大 部 分 最 种 见 的 增长 量 级 ， 按 照 更 
坏 的 程度 递增 : 


增长 量 级 


O (log pn) 对 数 级 (对 任意 b ) 


增长 量 级 名 称 


对 于 对 数 项 ， 改 数 并 没有 影响 ， 修 改 瓜 数 相当 于 乘 以 一 个 第 量 ， 
而 那样 并 不 影响 增长 量 级 。 类 似 地 ， 所 有 的 指数 函数 都 是 同一 个 增长 
量 级 ， 不 论 指数 的 帮 数 是 什么 。 指数 画 数 增长 非常 迅速 ， 所 以 指数 级 
算法 只 在 小 规模 问题 中 应 用 。 
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在 http:/en.wikipedia.org/wiki/Big_O_notation 上 阅读 大 0 标记 法 的 维 
基 百 科 页 面 ， 并 回答 下 列 问题 。 


1. n3+n? 的 增长 量 级 是 多 少 ? 1000000n3+n* 昵 ? mn3+ 
1000000n 2 呢 ? 


2、，(n?+n)-(n+ 1 的 增长 量 级 是 多 少 ? 在 相 乘 之 前 ， 请 记 住 你 只 
需要 首 项 。 


3. 如 末 f 是 O (g )， 对 于 未 指定 的 函数 g ， 我 们 怎么 说 aof+b? 


4， 如 果 f 1 和 f, 都 是 O (g )， 那 么 f 1 +f> 呢 ? 


5， 如果 广 是 O (g ) 而 f, 是 O (h )， 那 么 fi +f > 呢 ? 


6， 如果 f1 是 O (9 ) 而 f, 是 O (h )， 那 么 户 六 呢 ? 


关心 程序 性 能 的 程序 员 常 常会 觉得 这 种 分 析 很 难 理解 。 他 们 有 道 
: 有 时 候 系 数 和 非 目 项 也 能 市 来 不 同 。 有 了 时候 硬件 的 细 市 、 编 程 语 
， 以 及 输入 的 特征 ， 都 能 市 来 很 大 的 区 别 。 并 且 对 于 小 规模 问题 来 
说 ， 渐 进行 为 是 无 关 要 紧 的 。 


zl 里 


但 如 果 在 脑 中 记 着 这 些 需 要 注意 的 要 点 的 话 ， 算 法 分 析 毕 竟 是 一 
个 有 用 的 工具 。 至 少 对 于 大 规模 问题 来 说 ,“ 更 好 ”的 算法 往往 确实 更 
好 ， 并 且 有 时 候 它 会 好 得 多 。 两 个 增长 量 级 相同 的 算法 的 区 别 往往 是 
一 个 音量 值 ， 但 一 个 好 算法 和 一 个 坏 算法 的 差距 是 没有 弄 限 的 ! 


21.2 ”Python 基本 操作 的 分 析 


在 Python 中 ， 大 部 分 算术 操作 都 是 常量 时 间 的 ;乘法 通 稼 比 加 法 和 
减法 花费 更 多 时 间 ， 而 除法 花费 的 更 多 ， 但 这 些 操作 的 时 间 与 参数 的 
大 小 无 和 天。 特别 天 的 整数 羡 一 个 例外 ， 在 那 种 情况 下 ， 运 行 时 间 随 春 
数字 的 位 数 增 加 而 增加 。 


索引 操作 一 一 在 序列 或 字典 中 读 写 元 素 一 一 也 是 第 量 时 间 的 ， 与 
数据 结构 的 规模 无 关 。 


所 历 一 个 序列 或 字典 的 for 循环 通常 是 线性 的 ， 只 要 循环 体内 的 
操作 本 号 是 音量 级 。 例 如 ， 将 一 个 列表 的 元 素 相 加 和 是 线性 的 : 


total = 0 
for x in t: 


total += x 


内 荀 画 数 sum 也 十 线性 的 ， 因 为 它 做 相同 的 事情 。 但 它 趋 辣 于 更 
快 些 ， 因 为 实现 得 更 高 效 ， 用 算法 分 析 的 语言 来 说 ， 就 是 它 有 一 个 更 
小 的 首 项 系数 。 


作为 一 个 经 验 规则 ， 如 果 循 环 体 的 增长 量 级 是 O (na ) 则 整个 循环 是 
O (na)。 例 外 情况 是 当 你 能 够 证 明 循环 在 一 个 音量 数 的 迭代 之 后 吏 能 
退出 。 如 采 不 论 n 是 多 少 ， 循 环 只 最 多 运行 K 次 ， 则 即使 对 很 大 的 K 来 
说 ， 整 个 循环 的 增长 量 级 还 是 O (n? ) 。 

乘 以 k 并 不 会 改变 增长 量 级 ， 而 除法 也 不 会 。 所 以 ， 如 于 一 个 循环 
体 的 增长 量 级 是 O (na )， 那 么 它 运行 n/k 次 ， 即 使 对 很 大 的 k 来 说 ， 整 
个 循环 的 增长 量 级 也 仍然 是 O (ne 于) 。 


大 部 分 字符 串 和 元 组 操作 都 是 线性 的 ， 只 有 下 标 访问 和 1len 函数 
例外 ， 它 们 是 帝 量 级 时 间 的 。 内 置 男 数 min 和 max 是 线性 的 。 切 片 操 
作 的 运行 时 间 与 输出 的 长 度 成 正比 ， 而 与 输入 的 长 度 无 关 。 


字符 串 拼接 是 线性 的 ， 它 的 运行 时 间 与 操作 数 的 长 度 的 总 和 有 
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所 有 的 字符 串 方法 都 吓 线性 的 ， 但 如 果 字 符 串 的 长 度 受 限 于 一 个 
常量 (例如 ， 在 只 有 一 个 字符 的 字符 串 的 操作 ) ， 可 以 看 作 是 常量 
的 。 字 符 串 方法 join 是 线性 的 ， 它 的 运行 时 间 与 字符 串 的 总 长 度 有 
Ss 


大 多 数列 表 方 法 是 线性 的 ， 但 也 有 一 些 例外 。 


。 在 列表 结尾 处 添加 一 个 元 素 的 操作 平均 来 说 是 常量 时 间 的 ; 当 它 
空间 不 足 时 ， 偶 尔 会 复制 到 另 一 个 更 大 的 地 方 ， 但 总 的 mn 次 操作 的 
时 间 量 级 是 O (n )， 所 以 每 次 操作 的 平均 时 间 是 O (1)。 

从 列表 结尾 删除 一 个 元 素 的 操作 是 常量 时 间 的 。 

排序 的 量 级 是 O (n logn )。 


大 部 分 字典 操作 和 方法 都 是 常量 时 间 的 ， 但 也 有 一 些 例外 。 


update 的 运行 时 间 和 作为 参数 传 入 的 字典 的 大 小 成 比例 ， 而 不 是 
被 更 新 的 字典 本 吴 。 

keys 、values 和 items 都 是 常量 时 间 ， 因 为 它们 返回 的 是 迭代 
器 。 但 是 ， 如 果 循 环 志 历 这 个 欠 代 器 ， 则 循环 是 线性 的 。 


字典 的 效率 是 计算 机 科学 的 一 个 小 奇迹 。 我 们 会 在 21.4 了 中 介绍 它 
是 如 何 工作 的 。 
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在 http:Wen.wikipedia.org/wiki/Sorting_algorithm 了 阅读 排序 算法 的 维基 
百科 页 面 并 回答 下 列 问题 。 


1. 什么 是 “比较 排序 ”? 比较 排序 的 最 坏 情 况 的 增长 量 级 最 好 是 什 
么 ? 任何 排序 算法 中 ， 最 坏 情况 的 增长 量 级 最 好 是 多 少 ? 


2. 冒 泡 排序 的 增长 量 级 是 多 少 ? 为 什么 奥巴马 认为 它 是 “错误 的 
做 法 ”? 


3. 基数 排序 的 增长 量 级 是 多 少 ? 要 使 用 它 ， 我 们 需要 哪些 前 置 条 
人 


4. 稳定 排序 是 什么 ， 为 什么 在 实践 中 它 很 重要 ? 


5， 最 差 的 (有 名 字 的 ) 排序 算法 是 什么 ? 


6. C 语 言 库 里 用 的 排序 算法 是 什么 ?Python 里 用 的 是 什么 ? 这 些 
算法 稳定 吗 ? 你 可 能 需要 去 Google 搜 索 这 些 答 案 。 


7， 很 多 非 比较 排序 都 是 线性 的 ， 那 么 为 什么 Python 会 使 用 O (n 
logn ) 的 比较 排序 呢 ? 


21.3 ”搜索 算法 的 分 析 


搜索 是 一 种 算法 ， 接 收 一 个 集合 和 一 个 目标 元 素 ， 并 决定 这 个 元 
素 是 否 在 集合 中 ， 通 肖 返 回 元 素 的 索引 。 


最 简单 的 搜索 算法 是 “线性 搜索 "， 即 按 顺序 裔 历 集 合 的 每 一 个 元 
素 ， 直 到 找到 目标 元 素 为 止 。 在 最 坏 的 情况 下 ， 它 会 般 历 整个 集合 ， 
所 以 运行 时 间 是 线性 的 。 


序列 的 in 操作 符 使 用 一 个 线性 搜索 ;字符 串 方 法 find 和 count 
也 是 这 样 。 


如 果 序 列 中 的 元 素 是 排 好 序 的 ， 可 以 使 用 二 分 查找 ， 它 的 增长 量 
级 是 O (log n )。 二 分 查找 和 在 字典 (真实 的 字典 ， 而 不 是 那个 数据 结 
构 ) 中 查找 单词 的 算法 类 似 。 不 像 普通 搜索 那样 从 第 一 个 元 素 开始 ， 


它 是 从 序列 的 中 间 开始 ， 检 查 要 查找 的 词 是 在 中 间 的 元 素 之 前 还 是 之 
后 。 如 果 在 之 前 ， 则 继续 查找 序列 的 前 半 段 ， 否 则 查找 后 半 段 。 不 论 
哪 种 情况 ， 都 可 以 将 查找 的 数量 减少 一 半 。 


如 果 序 列 有 1 000 000 个 元 素 ， 大 概 需 要 花 20 个 步骤 找到 单词 或 者 
发 现 它 不 存在 。 所 以 那样 会 比 线性 查找 快 大 概 50 000 倍 。 


二 分 查找 可 以 比 线性 查找 快 很 多 ， 但 需要 序列 本 身 是 排 好 序 的 ， 
也 束 需 要 一 些 额 外 工作 。 


有 男 一 个 数据 结构 ， 称 为 散 列表 (hashtable) ， 它 甚至 更 快 一 一 
它 可 以 用 常量 时 间 来 搜索 一 一 而 且 不 需要 元 素 是 排 好 序 的 。Python 字 典 
征 使 用 散 列 表 实 现 的 ， 因 此 天 部 分 字典 操作 ， 包 括 in 操 a 作答， 部 钙 肖 
量 时 间 的 。 


21.4 ” 散 列 表 


为 了 解释 歼 列 表 的 工作 机 制 以 及 为 何 它 的 效率 如 此 好 ， 我 们 先 从 
一 个 简单 的 映射 实现 开始 ， 并 逐步 改善 它 ， 直 到 成 为 一 个 散 列 表 。 


我 使 用 Python 来 展示 这 些 实现 。 但 真实 世界 中 ， 你 不 需要 用 Python 
写 这 样 的 代码 ， 你 只 需要 直接 使 用 字典 即 可 ! 所 以 本 章 中 剩 下 的 部 
分 ， 你 需要 想象 字典 并 不 存在 ， 而 你 需要 实现 一 个 数据 结构 将 键 映 射 
到 值 。 你 需要 实现 的 操作 有 以 下 几 个 。 


add(k, v) 


添加 一 个 新 项 ， 将 键 k 映射 到 值 v。 在 Python 字典 d 中 ， 这 个 操作 
写作 d[k] = V 。 


get (kK ) 


根据 键 k 查找 对 应 的 值 。 在 Python 字典 d 中 ， 这 个 操作 写作 d[k] 
或 d.get(k)。 


束 现 在 来 说 ， 我 假设 每 个 键 只 出 现 一 次 。 最 简单 的 实现 是 使 用 一 
个 元 组 列表 ， 每 个 元 组 是 一 个 键 值 对 : 


class LinearMap: 


def init_ _(self): 


self.items = [] 


def add(self, k, v): 
self.items.append((k, v)) 


def get(self, k): 
for key, val in self.items: 
If key == k: 
return val 
raise KeyError 


add 往 元 组 列表 中 添加 一 项 ， 这 个 操作 是 闻 量 时 间 的 。 


get 使 用 一 个 for 循环 来 搜索 列表 : 如 果 找 到 了 目标 键 ， 则 返回 
对 应 的 值 ， 否 则 抛 出 KeyError 。 所 以 get 是 线性 的 。 


另 一 个 方案 是 让 列表 按照 键 来 排序 。 这 样 get 避 ® 可 以 使 用 二 分 查 
找 ， 其 增长 量 级 是 O (logn )。 但 插入 一 个 者 项 到 列表 中 间 是 线性 的 ， 所 


以 这 可 能 也 不 是 最 好 的 选择 。 也 有 数据 结构 可 以 用 对 数 时 间 实 现 add 
和 get ， 但 那 仍然 没有 常量 时 间 好 ， 所 以 我 们 继续 。 


改 矢 LinearMap 的 方法 之 一 是 将 键 值 对 的 列表 拆 分 成 更 小 的 列 
表 。 下 面 是 一 个 称 为 BetterMap 的 实现 ， 它 是 一 个 包含 100 个 
LinearMap 的 列表 。 我 们 接 下 来 会 看 到 ，get 的 增长 量 级 仍然 是 线性 
的 ， 但 是 BetterMap 离散 列表 更 近 了 一 步 。 


class BetterMap : 


n=100 ) : 


for i in range(n): 
self.maps.append(LinearMap()) 


def find_map(self, k): 
index = hash(k) % len(self.maps) 
return self.maps[index] 


def add(self, k, v): 
m = self.find_map(k) 
m.add(k, v) 


def get(self, k): 
m = self.find_map(k) 
return m.get(k) 


_init _ 创建 由 n 个 LinearMap 组 成 的 列表 。 


find_map 被 add 和 get 调用 ， 用 来 确定 用 哪个 映射 来 保存 新 
项 ， 或 者 到 哪个 映射 里 去 搜索 。 


find_map 使 用 了 内 置 画 数 hash ， 它 接收 几乎 所 有 的 Python 对 
象 ， 并 返回 一 个 整数 。 这 个 实现 的 限制 之 一 是 它 只 对 可 散 列 的 键 类 型 
可 用 。 可 变 类 型 ， 如 列表 和 字典 ， 有 是 不 可 散 列 的 。 


两 个 认为 相等 的 可 散 列 对 象 会 返回 相同 的 散 列 值 ， 但 反 过 来 并 不 
一 定 是 真 : 两 个 具有 不 同 值 的 对 象 可 以 返回 相同 的 散 列 值 。 


find_map 使 用 求 余 操 作 符 来 将 散 列 值 封装 到 0 到 
len(self,maps) 的 范围 中 ， 这 样 结果 是 列表 的 一 个 合法 索引 。 当 
然 ， 这 意味 着 很 多 不 同 的 获 列 值 会 封装 到 同一 个 索引 上 。 但 如 散 列 画 
数 将 对 象 分 配 地 很 均匀 (这 也 是 散 列 画 数 设计 的 目标 ) ， 那 么 我 们 预 
计 每 个 LinearMap 有 n /100 个 项 。 


因为 LinearMap ,get 的 运行 时 间 是 和 其 包含 的 项 数 成 比例 的 ， 
所 以 我 们 预计 BetterMap 会 比 LinearMap 快 100 倍 。 增 长 量 级 仍然 是 线 
性 ， 但 自 项 系数 更 小 。 这 很 好 ， 但 仍然 不 如 散 列 表 好 。 


下 面 (终于 ) 是 让 散 列表 能 变 快 的 关键 原因 : 如 果 你 能 保证 
LinearMap 的 长 度 有 限 ，LinearMap .get 则 会 是 常量 时 间 。 你 需要 做 
的 只 是 记录 元 素 的 总 数 ， 并 当 每 个 LinearMap 的 大 小 超过 一 个 阐 值 时 ， 
重新 划分 散 列 表 ， 添 加 更 多 的 LinearMap 。 


下 面 是 一 个 艇 列表 的 实现 : 


class HashMap : 


def _ _init_ _(self): 


self.maps = BetterMap(2) 
self.num = 0 


def get(self, k): 
return self.maps.get(k) 
def add(self, k, v): 
If self.num == len(self.maps.maps): 
self.resize() 


self.maps.add(k, v) 


self.num += 1 


de 


下 


resize(self): 
new_maps = BetterMap(self.num * 2) 


for m in self.maps.maps: 
for k, v in m.items: 
new_maps.add(k, v) 


self.maps = new_maps 


每 个 HashMap 都 包含 一 个 BetterMap; _ init 从 2 个 
LinearMap 开 始 ， 并 初始 化 num ， 它 会 用 来 记录 总 的 项 数 。 


get 只 需要 分 配 到 对 应 的 BetterMap 。 真 正 的 工作 都 发 生 在 add 
中 ， 它 会 检查 项 数 和 BetterMap 的 大 小 : 如 果 相 等 ， 那 么 每 个 
LinearMap 的 平均 项 数 是 1， 所 以 它 调用 resize 。 


resize 创建 一 个 新 的 BetterMap ， 比 之 前 大 一 倍 ， 并 将 旧 有 的 
映射 中 的 项 “重新 散 列 ”到 新 的 映 里 中 。 


重新 散 列 是 有 必要 的 ， 因 为 LinearMap 的 数量 的 改变 ， 导 致 
find_map 的 求 余 操 作 符 的 分 母 改 变 。 也 融 是 说 ， 有 些 原 移 会 散 列 到 
同一 个 LinearMap 的 项 会 分 配 到 不 同 的 LinearMap 中 (这 也 是 我 们 想 要 
的 ， 对 吧 ? ) 。 


重新 散 列 是 线性 的 ， 所 以 resize 是 线性 的 ， 看 起 来 可 能 不 好 ， 因 
为 我 保证 过 add 应 当 是 毅 量 时 间 的 。 但 请 记得 我 们 并 不 是 每 次 都 需要 
进行 resize ， 所 以 add 通 利 是 单 量 时 间 的 ， 只 是 偶尔 会 线性 。add 
运行 n 次 的 总 时 间 是 和 n 成 比例 的 ， 因 此 每 次 调用 add 的 平均 时 间 坪 利 
量 时 间 ! 


要 明日 散 列 表 如 何 工 作 ， 考 虑 从 一 个 空 的 HashTable 开 始 ， 并 添加 
一 些 项 。 我 们 从 2 个 LinearMap 开 始 ， 所 以 最 开始 两 个 add 会 很 快 (不 
需要 resize ) 。 我 们 说 它们 每 次 花费 一 单位 的 工作 量 。 下 一 个 add 
会 需要 resize ， 所 以 我 们 需要 重新 散 列 前 两 项 (我 们 说 这 需要 再 加 2 
个 单位 的 工作 量 ) 并 添加 一 个 新 项 (再 加 1 个 单位 ) 。 再 添加 一 项 花费 
1 单位 ， 所 以 至 今 为 止 是 4 项 花费 了 6 个 单位 的 工作 。 


下 一 个 add 需要 5 个 单位 ， 但 接着 的 3 个 都 只 需要 1 个 单位 ， 所 以 总 
共 是 8 项 花费 了 14 单 位 。 


再 下 一 个 add 需要 9 个 单位 ， 但 接着 我 们 可 以 在 再 次 resize 之 前 
添加 7 项 ， 所 以 总 共 是 16 个 add 花费 了 30 单 位 。 


在 32 个 add 时 ， 总 共 的 花费 是 62 单 位 ， 而 我 希望 你 已 经 开始 看 到 
其 中 的 模式 了 。 在 n 个 add 之 后 ， 假 设 n 是 2 的 乘 方 ， 总 的 花费 是 2n -2 
单位 ， 所 以 平均 每 个 add 的 工作 量 是 稍微 小 于 2 个 单位 的 。 当 n 是 2 的 乘 
方 时 ， 这 是 最 好 情况 ， 对 于 其 他 的 n 值 ， 平 均 工作 量 稍 高 一 点 ， 但 这 并 
不 重要 。 重 要 的 是 这 是 0 (1)。 


图 21-1 用 图 形 化 的 方式 展示 了 这 个 过 程 。 每 个 方块 代表 一 个 蛙 位 的 
工作 量 。 每 一 列 显 示 每 个 add 的 工作 量 : 从 左 到 右 ， 前 两 个 add 花费 1 
单位 ， 第 三 个 化 费 3 单 位 ， 等 等 。 


中 ELELLETLILLELEL 
LLILLLLLLLLLLLLILTLI LLILLLLLLDLLLLLLLLI 
图 21-1 散 列表 add 的 消耗 


多 余 的 重新 散 列 的 工作 看 起 来 像 一 序列 不 断 增高 的 塔 ， 之 间 的 间 
隅 越 来 越 远 。 现 在 如 采 你 将 捧 推 倒 ， 将 resize 的 花费 均 摊 到 所 有 add 
操作 上 ， 就 会 发 现 n 个 add 之 后 总 的 花费 是 2n -2 。 


这 个 算法 的 一 个 重要 特点 是 当 我 们 调整 HashTable 的 天 小 时 ， 它 会 
几何 增长 ;也 束 是 ， 我 们 乘 以 一 个 解 量 到 大 小 上 。 如 有 打算 术 地 增加 大 
每 次 添加 固定 数量 的 数 一 一 那么 每 个 add 的 平均 时 间 是 线性 


小 


Hs 


可 以 从 http://thinkpython2.com/code/Map.py 下 载 我 的 HashMap 实 
现 ， 但 请 记 住 并 没有 使 用 它 的 理由 。 如 果 需 要 一 个 映射， 直接 用 Python 
字典 即 可 。 


21.5 ”术语 表 


算法 分 析 (analysis of algorithms) : 通过 对 比 运行 时 间 以 及 /或 者 
空间 需求 来 对 比 算 法 的 方法 。 


机 器 模型 (machine model) : 用 于 描述 算法 的 简化 的 计算 机 表示 
形式 。 


最 坏 情况 (worst case) : 让 指定 算法 运行 最 慢 (或 者 需要 最 多 空 
间 的 ) 的 输入 。 


首 项 (leading term) : 在 多 项 式 中 ， 指 数 最 高 的 项 。 


交叉 点 (crossover point) : 两 个 算法 需要 相同 的 运行 时 间或 空间 
的 问题 规模 。 


增长 量 级 (order of growth) : 在 算法 分 析 时 ， 如 果 我 们 认为 一 组 
函数 的 增长 速度 可 以 看 作 相 等 ， 则 将 这 组 函数 称 为 同一 个 增长 量 级 
的 。 例 如 ， 所 有 线性 增长 的 钞 数 部属 于 同一 个 增长 量 级 。 


大 0 表示 法 (Big-Oh notation) : 表达 增长 量 级 的 方法 。 例 如 ，O 
(n ) 表 示 所 有 线性 增长 的 函数 集合 。 


线性 〈linear) : 运行 时 间 和 问题 规模 (至 少 对 于 大 规模 来 说 成 
正比 的 算法 。 


平方 量 级 (gquadratic) : 运行 时 间 和 2 成 正比 的 算法 ， 其 中 n 指 
的 是 问题 规模 。 


搜索 (search) : 定位 集合 (如 列表 或 字典 ) 中 某 个 元 素 或 者 判定 
它 不 在 其 中 的 问题 。 


散 列 表 (hashtable) : 一 种 表示 键 值 对 集合 且 搜 索 是 常量 级 的 数 
据 结构 。 


[1] 但 如 琳 你 在 面试 时 被 问 到 这 个 问题 ， 我 觉得 更 好 的 答案 是 :“ 给 100 
万 个 数 排序 的 最 快 算法 应 当 是 使 用 我 用 的 语言 提供 的 排序 函数 。 它 的 
性 能 应 当 对 绝 大 多 数 应 用 都 足够 好 了 ， 但 如 果 发 现 我 的 程序 太 慢 ,我 
会 使 用 一 个 性 能 分 析 器 去 查看 时 间 花 在 哪里 。 如 果 看 起 来 更 快 的 排序 
算法 会 带 来 明显 的 提升 ， 那 我 会 去 寻找 一 个 基数 排序 的 良好 实现 。” 


译 后 记 


《 像 计算 机 科学 家 一 样 思考 》 这 一 系列 书 ， 早 有 耳闻， 它 可 谓 开 
创 了 程序 设计 入 门 书 的 一 个 新 思路 。 授 人 以 鱼 ， 不 春 授 人 以 渔 : 教 人 
编程 ， 不 如 引导 人 思考 ; 教 人 语言 细节 ， 不 若 指明 语言 精 要 。 而 结合 
Python 语言 之 后 ， 得 到 的 《 像 计 算 机 科学 家 一 样 思考 Python》 这 本 
书 ， 则 是 在 这 个 思路 上 走 到 了 一 个 极致 的 佳作 。 


我 是 工作 之 后 才 开 始 接触 Python 的 。 在 那 之 前 一 直 使 用 C/C++、 
Java、C# 等 传统 风格 的 语言 ， 再 看 到 Python， 不 免 有 耳目 一 新 之 感 。 
为 何以 往 先 得 星 涩 难 懂 的 程序 设计 理念 ， 在 Python 中 却 表达 得 这 么 简 
洁 易 收 ? 为 何以 往 需 要 绞 尽 脑 守 才能 拼 出 来 的 大 段 代 码 ， 在 Python 里 
却 只 需要 几 个 简单 调用 即 可 ? 为 何 繁复 的 集合 操作 ， 在 Python 中 却 只 
需要 一 行列 表 理解 循环 语句 就 完成 了 ? 为 何 Python 的 文档 那么 容易 
找 ， 还 可 以 使 用 交互 模式 轻松 尝试 ? 每 次 使 用 Python 编写 程序 之 后 ， 
总 会 感慨 ， 当 初 初学 程序 设计 语言 的 时 候 ， 如 有 果 教 的 是 Python 该 多 
好 。 相 信 所 有 学 过 C/C++ 之 后 再 接触 Python 这 类 语言 的 人 ， 都 会 有 相 
同 的 感受 吧 。 


那么 是 什么 原因 让 C/C++ 几乎 垄断 了 程序 设计 语言 的 教材 呢 ? 我 
觉得 更 多 的 是 历史 惯性 。 在 计算 机 科学 教育 开始 普及 的 20 世 纪 70、80 
年 代 ，C 语 言 正在 其 稀 盛 时 期 ， 几 乎 所 有 的 人 都 在 用 C 开 发 程序 ， 操 作 
系统 、 软 件 、 游 戏 儿 乎 都 是 用 C 甚 至 汇编 开发 的 。 人 硬件 性 能 的 限制 ， 
让 那些 更 抽象 、 更 高 阶 的 语言 ， 无 法 普及 开 来 。 因 此 教学 目 然 也 使 用 


它 。 久 而 久之 形成 了 惯性 ， 到 了 新 世纪 ， 程 序 设计 的 教学 已 经 赶不上 
语言 发 展 的 漳 流 了 。 我 们 的 程序 越 来 越 复杂 ， 越 来 越 像 人 脑 ， 而 教学 
的 语言 仍然 在 使 用 局 级 语言 中 最 贴近 机 需 的 C。 而 C++、Java、C#， 虽 
然 相对 于 C 更 抽象 高 阶 ， 但 由 于 这 些 语 言 设 计 的 初衷 仍 是 以 扩展 C 为 

主 ， 所 以 不 过 是 在 这 一 惯性 上 多 走 了 五 十 步 而 已 。 


本 书 正 是 扭转 这 种 矛盾 局 面 的 一 个 有 益 的 答 试 。《 像 计算 机 科学 
家 一 样 思 考 》 是 对 程序 设计 教学 模式 的 真 详 的 领 俩 ， 而 使 用 Python 这 
种 简洁 强大 的 高 阶 语言 ， 也 正 是 这 种 新 思路 最 贴切 的 贯彻 。 授 人 以 
渔 ， 目 然 应 当 用 最 好 的 渔具 ;引导 人 思考 ， 当 然 也 应 使 用 更 贴近 人 的 
思路 而 不 是 机 器 思路 的 语言 。Python 在 高 阶 语言 中 ， 是 一 个 从 理念 和 
实际 综合 考量 后 非常 合适 的 候 移 。 


在 翻译 过 程 中 我 发 现 ， 本 书 不 但 思路 很 贴切 其 教学 主 昌 ， 从 行文 
和 用 例 来 看 也 非常 浅显 易 懂 。 全 书 讲 了 非常 多 的 程序 设计 理念 ， 在 读 
过 之 后 却 会 觉得 那些 理念 部 很 目 然 ， 大 概 也 十 因为 作者 至 心安 排 ， 前 
后 穿插 ， 让 读者 能 人 循序 渐进 地 明日 每 个 程序 设计 理念 是 因为 什么 而 出 
现 的 原因 吧 。 这 种 风格 ,再 配合 上 精心 编辑 的 示例 ， 用 于 介绍 任何 程 
序 设计 语言 ， 都 是 非常 合适 的 。 


如 有 果 将 来 我 的 孩子 愿意 学 习 程序 设计 ， 我 愿意 用 这 本 书 教 他 。 


这 一 版 ， 将 语言 升级 到 Python 3， 从 而 更 加 贴近 语言 发 展 的 趋 
势 。 作 者 对 革 市 内 容 和 示例 练习 也 做 出 了 重新 组 织 和 调整 ， 使 得 阐述 
行文 更 加 通畅 。 


尽管 我 已 尽 最 大 努力 争取 译文 准确 、 完 善 ， 但 仍然 难免 有 芷 漏 之 
处 ， 如 发 现 问题 ， 欢 迎 批评 指正 。 电 子 邮 箱 zhaopuming@gmail.com 。 


译 者 介绍 


赵普 明 ”毕业 于 清华 大 学 计算 机 系 ， 从 事 软件 开发 行业 近 10 年 。 
从 2.3 版 本 开始 接触 Python， 工 作 中 使 用 Python 编写 脚本 程序 ， 用 于 快 
速 原型 构建 以 及 日 志 计 算 等 日 常 作业 ; 业余 时 ， 作 为 一 个 编程 语言 爱 


好 者 ， 对 D、Kotlin、Lua、Clojure、Scala、Julia、Go 等 语言 均 有 了 
解 ， 但 至 今 仍 为 Python 独特 的 风格 、 简 少 的 设计 而 司 叹 。 


作者 介绍 


Allen Downey 是 欧 林 工程 学 院 (Olin College of Engineering) 的 计 
算 机 科学 教授 。 他 曾 在 韦 尔 斯 利 学 院 (Wellesley College) 、 科 尔 比 学 
院 (Colby College) 和 加 州 大 学 伯克利 分 校 (U.C. Berkeley) 任教 。 
他 从 加 州 大 学 伯克利 分 校 获得 计算 机 科学 博士 学 位 ， 并 从 MIT 获 得 硕 
士 和 学 士 学 位 。 


封面 介绍 


本 书 封面 的 动物 是 卡罗来纳 鹦 融 ， 也 叫 卡罗来纳 长 尾 则 下 (学 名 
Conuropsis carolinensis) 。 这 种 鹦 避 分 布 于 美国 东南 部 ， 并 且 是 一 种 
栖息 在 墨西哥 以 北 的 大 陆 鹦 开 ， 它 们 最 北 曾 一 度 到 达 纽 约 和 大 湖区 ， 
但 主要 分 布 在 佛罗里达 州 到 卡罗来纳 州 一 带 。 


卡罗来纳 册 弄 主 色 是 绿色 ， 尖 部 黄色 ， 成 熟 时 前 额 和 两 正 会 出 现 
一 些 要 红 色 的 条 纹 。 它 的 平均 尺寸 是 31~33 cm。 它 叫 声 狂 又 而 巨大 ， 
并 且 在 捕食 过 程 中 会 唆 唆 不 体 。 它 居住 在 沼 译 与 河畔 的 树 洞 中 。 卡 罗 
来 纳 婴 起 是 喜欢 群居 的 生物 ， 平 时 以 小 群体 形式 生活 ， 在 捕食 时 可 以 
这 到 省 再 呈 有 


不 幸 的 是 ， 这 些 捕食 过 程 往往 在 农田 的 庄稼 地 里 进行 ， 农 夫 会 射 
击 它 们 ， 以 免 破 坏 庄 穆 。 它 们 的 群体 特性 让 它们 会 集体 救助 受伤 的 婴 
引 ， 结 采 让 农夫 可 以 一 次 杀 光 整 群 鹦 釉 。 不 但 如 此 ， 它 们 的 羽毛 被 用 
做 妇女 的 帽 所 ， 也 有 一 些 赐 民 被 作为 宠物 。 这 些 因 素 组 合 起 来 ， 导 致 
在 19 世 纪 了 晚期， 卡罗来纳 鹦 赵 变 得 非常 稀少 ， 并 且 禽 类 疾病 也 加 剧 了 
它们 的 减少 。 到 20 世 纪 20 年 代 ， 这 个 物种 灭绝 了 。 


今天 ， 全 世界 的 博物 馆 中 保存 了 700 多 只 卡罗来纳 鹦 殉 的 标本 。 


很 多 O’Reilly 的 书 封 面 上 的 动物 都 是 濒危 物种 ， 它 们 全 都 对 世界 有 
重要 意义 。 请 访问 animals.oreilly.com 来 了 解 如 何 帮 助 它们 的 信息 。 


封面 图 片 来 自 《约翰 逊 的 自然 历史 》 (Johnsons Natural History 


欢迎 来 到 异步 社区 ! 


异步 社区 的 来 历 


异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 出 版 社 旗下 IT 专业 图 书 旗 
舰 社 区 ， 于 2015 年 8 月 上 线 运营 。 


异步 社区 依托 于 人 民 邮 电 出 版 社 20 余 年 的 IT 专业 优质 出 版 资源 和 
编辑 策划 团队 ， 打 造 传 统 出 版 与 电子 出 版 和 上 自 出 版 结合 、 纸 质 书 与 电 
子 书 结合 、 传 统 印 刷 与 POD 按 需 印 刷 结合 的 出 版 平台 ， 提 供 最 新 技术 
资讯 ， 为 作者 和 读者 打造 交流 互动 的 平台 。 


本 ea [罗技 蓄 Q| 四 兵员 (0) 虑 到 x0 区 


新 诈 新 握 委 


社区 UI 全 新 改版 ， 产 新 面 租 迎接 20171 为 答谢 社区 用 户 


即日 起 到 | 太 A 1 r - 
1 月 26 号 ele 3 书 8 扩 优惠 | 


Write for Us 


Python 机 器 学 习 一 预 。 贝 叶 斯 方法 ; 克 谍 演 程 。 机 名 学 习 项 目 开发 实战 。。 贝 时 斯 思 堆 : 统计 建 模 
再 分 析 核心 算法 与 贝 叶 斯 推 其 的 Python 学 习 法 近期 活动 


社区 里 都 有 什么 ? 
购买 图 书 


我 们 出 版 的 图 书 涵盖 主流 IT 技 术 ， 在 编程 语言 ~、Web 技 术 、 数 据 科 
学 等 领域 有 众多 经 典 畅 销 图 书 。 社 区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 
400 多 种 ， 部 分 新 书 实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 发 布 新 
书 书 讯 。 


下 载 资源 


社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代码 。 


男 外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 
束 可 以 免费 下 载 。 


与 作 译 者 互动 


很 多 图 书 的 作 译 者 已 经 入 驻 社区 ， 您 可 以 关注 他 们 ， 咨 询 技术 问 
题 ; 可 以 阅读 不 断 更 新 的 技术 文章 ， 听 作 译 者 和 编辑 畅 聊 好 书 背 后 有 
趣 的 故事 ;还 可 以 参与 社区 的 作者 访谈 栏目 ， 回 您 天 广 的 作者 提出 采 
访 题目 。 


灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 
民 邮 电 出 版 社 书库 发 货 ， 电 子 书 提供 多 种 阅读 格式 。 


对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 
间 买 到 心仪 的 新 书 。 


用 户 帐户 中 的 积分 可 以 用 于 购书 优惠 。100 积 分 =1 元 ， 购 买 图 书 
时 ,在 ”RE 里 项 入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


ess 0 | 


购买 本 电子 书 的 读者 专 享 异步 社区 优惠 券 。 使 用 方法 ， 注 册 成 为 社区 用 户 ， 在 下 单 购 
书 时 输入 "57AWG ”， 然 后 点 击 “ 使 用 优惠 码 ”， 即 可 享受 电子 书 8 折 优惠 (本 优惠 券 只 可 使 用 
一 次 ) 。 


纸 电 图 书 组 合 购买 


社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购买 方式 ， 价 格 优惠 ， 一 次 
购买 ， 多 种 阅读 选择 。 


| Wireshark 网 络 分 析 的 艺术 本 书 作 谨 省 
| 
| 作者 ; 林 江 过 ; 
Lou 到 LinPeiman 进 
算 机 科学 > 安全 与 加 密 > 网 妆 安 全 
_ 时 上 海 
Wireshark 是 当前 最 沪 行 的 网 络 包 分 析 工 具 ， 亡 上 手 移 单 ,无 才 培 训 极 可 入 门 。 很 名 
相手 的 网 塔 问题 昌 到 Wirezhark 斩 能 迎 刀 而 解 ， 1.0K 既 验 值 
, 本 书 搞 适 的 网 结 包 来 自 真 实 场景 ， 经 并 且 接 好气 。 讲 解 时 采用 了 生活 化 能 。 更 多 >> ee 
Wireshatk es 2 ie ED ED 
网 铬 分 煌 的 有 市 9 了 P 凌 文件 下 载 5.6K 57 7 信 关注 | 
间 秽 想 座 


《Wiresha 水 网 络 分 析 就 这 么 障 
单 》 咖 《Wireshark 刚 络 分 析 的 艺 
术 》 作 者 


分享 :四 号 


| 远 质 尽 4560-Y3150 07 折 || 电子 ¥250 | 电子 + 纸 质 ¥450 | 


电子 书 帮 本 
目录 评论 加 EX 和 出 版 信息 
| 伟 开 推荐 
者 荡 介 
SN | 
| 内 容 提 要 后 了 和 


社区 里 还 可 以 做 什么 ? 


提交 勘误 


您 可 以 在 图 书页 面 下 方 提 交 勘 误 ， 每 条 勘误 被 确认 后 可 以 获得 100 
积分 。 热 心 勘 误 的 读者 还 有 机 会 参与 书稿 的 审 校 和 翻译 工作 。 


写作 


性 区 提供 基于 Markdown 的 写作 环境 ， 喜 欢 写 作 的 您 可 以 在 此 一 试 
身手 ， 在 社区 里 分 享 您 的 技术 心得 和 读书 体会 ， 更 可 以 体验 目 出 版 的 
乐趣 ， 轻 松 实现 出 版 的 梦想 。 


如 有 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 享 
特色 服务 。 


会 议 活 动 早 知道 
您 可 以 掌握 代 圈 的 技术 会 议 资 讯 ， 更 有 机 会 免费 获 赠 大 会 门票 。 


加 入 异步 


扫描 任意 二 维 码 都 能 找到 我 们 : 


异步 社区 


微 信服 务 号 


QQ 群 : 436746675 


社区 网 址 : www.epubit.com.cn 
官方 微 信 : 异步 社区 


官方 微 博 : @ 人 邮 异 步 社区 ，@ 人 民 邮 电 出 版 社 -信息 技术 分 社 


投稿 & 咨 询 : contact@epubit.com.cn 


